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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



International application No. 

PCT/EP99/07952 



I. Basis of the rep rt 



1. With regard to the elements of the international application:* 
|~| the international application as originally filed 
[X] the description: 

pages 1-108 _ , as originally filed 

pages » ^ e< * w ^ ^ demand 

pages , filed with the letter of 



the claims: 

pages M6 , as originally filed 

pages » as amended (together with any statement under Article 19 

pages > filed with the demand 

pages filed with the letter of 



^ the drawings: 

pages 1/3-3/3 , as originally filed 

pages * ^* ec * ~ e demand 

pages , filed with the letter of 



I the sequence listing part of the description: 



9 as originally filed 



pages , filed with the demand 

pages , filed with the letter of 

2. With regard to the language, all the elements marked above were available or furnished to this Authority in the language in which 
the international application was filed, unless otherwise indicated under this item. 

These elements were available or furnished to this Authority in the following language which is: 

| | the language of a translation fiirnished for the purposes of international search (under Rule 23. 1(b)), 
| | the language of publication of the international application (under Rule 48.3(b)). 

| | the language of the translation furnished for the purposes of international preliminary examination (under Rule 55.2 and/ 
or 55.3). 

3. With regard to any nucleotide and/or amino acid sequence disclosed in the international application, the international 
preliminary examination was carried out on the basis of the sequence listing: 

% contained in the international application in written form. 

[X] filed together with the international application in computer readable form. 

I | furnished subsequently to this Authority in written form. 

I | furnished subsequently to this Authority in computer readable form. 

I | The statement that the subsequently furnished written sequence listing does not go beyond the disclosure in the 

international application as filed has been furnished. 
I | The statement that the information recorded in computer readable form is identical to the written sequence listing has 

been furnished. 

4. Q The amendments have resulted in the cancellation of: 

[~] the description, pages 

I I the claims, Nos. 



f 1 the drawings, sheets/fig . 



| I This report has been established as if (some of) the amendments had not been made, since they have been considered to go 

* —— ' beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)).** 

* Replacement sheets which have been furnished to the receiving Office in response to an invitation under Article 14 are referred to 
in this report as "originally filed" and are not annexed to this report since they do not contain amendments (Rule 70,16 
and 70.17). 

** Any replacement sheet containing such amendments must be referred to under item 1 and annexed to this report. 
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V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



1 . Statement 

Novelty (N) 

Inventive step (IS) 
Industrial applicability (IA) 



Claims 
Claims 

Claims 
Claims 

Claims 
Claims 



2, 7-10, 14 YES 



YES 

1-16 NO 

1 " 16 YES 

NO 



1, 3-6, 11-13, 15-16 NO 



2. Citations and explanations 

This report makes reference to the following document: 

Dl EP-A-0 845 532. 

1 . Novelty 

Dl discloses the enzymes of Pseudomonas sp. HR 199, which 
are responsible for the degradation of eugenol, and its 
gene sequences (Figure 1; SEQ ID NOS : 1-42) . Two different 
strategies were used for their characterisation* Mutants 
of this strain were isolated using nitroguanidine and 
classified with respect to their capacity to be able to 
use eugenol, ferulic acid and vanillin as a C and energy 
source (page 7, Example 1) . For example, it was 
demonstrated that the mutant 6164, which was no longer 
able to use eugenol but, like the wild type, was able to 
utilise ferulic acid and vanillin, could be complemented 
by the coniferyl alcohol dehydrogenase (CADH) gene (page 

8, Example 5) . This gene was further identified by the 
cleaning of the enzyme CADH, the determination of its N- 
terminal amino-acid sequence and the formation of a gene 
probe which could hybridise with the isolated gene (page 

9, Example 6) . 
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International application No. 
PCT/EP 99/07952 



The subject matter of Claims 1, 3 to 6, 11 to 13 and 15 to 
16 is anticipated by the method disclosed in Dl. For this 
reason, Claims 1, 3 to 6, 11 to 13 and 15 to 16 do not 
meet the requirements of PCT Article 33(2). 

2 . Inventive step 

The method disclosed in Dl anticipates the subject matter 
of the present application. 

The only difference from Dl is that the genes were 
deactivated by means of methods in genetic engineering 
(insertion or deletion) (Claims 2, 7 to 10 and 14) and not 
by means of chemical mutagenesis. This technical feature 
is not inventive because it is well known to a person 
skilled in the art. 

Consequently, the subject matter of Claims 2, 7-10 and 14 
does not involve an inventive step and therefore does not 
meet the criterion stipulated in PCT Article 33(3). 
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International application No. 
PCT/EP 99/07952 



VIII. Certain observations on the international application 

The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
supported by the description, are made: 

1. The present application demonstrates that this 
method functions with the bacterium Pseudomonas. 
However, it does not provide any basis or example 
for a different unicellular organism and, 
particularly, for a "multicellular organism". For 
this reason, Claim 1 is not sufficiently supported 
and thus does not meet the requirements of PCT 
Article 6. 

2. Claim 1 clearly has to be restricted to non-human 
animals . 

3. It looks as if Claims 7 and 8 should be dependent on 
Claim 6. 

4. The expressions "preferably" or "in particular" only 
introduce a preferred variant. However, this does 
not limit the scope of Claims 4-5 and 12. 

5. In Claim 7, the gene structures should not be 
defined with a reference to the drawing but by 
technical features , 

6. The gene structures in Claim 8 should not be defined 
with reference to the drawing but to the sequence. 
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BER DIE INTERNATIONALRUSAMMENARI 
GEBIET DES PATENTWESENS 



T 1? 

\WIPO 



PCT 

INTERNATIONALER VORLAUFIGER PRUFUNGSBERICHT 

(Artikel 36 und Regel 70 PCT) 



Aktenzeichen des Anmelders Oder Anwalts 
HR199-WO 


siehe Mitteilung uber die Ubersendung des intemationalen 
WEITERES VORGEHEN vorlaufigen Prufungsberichts (Formblatt PCT/IPEA/416) 


Internationales Aktenzeichen 
PCT/EP99/07952 


Internationales AnmeldedatumfT ag/Monat/Jahr) 
20/10/1999 


Prioritatsdatum (Tag/Monat/Tag) 
31/10/1 998 



Internationale Patentklassifikation (IPK) oder nationale Klassifikation und IPK 
C12N 15/00 



Anmelder 

HAARMANN & REIMER GMBH et al. 

1 . Dieser Internationale vorlaufige Prufungsbericht wurde von der mit der intemationalen vorlaufigen PrOfung beauftragten 
Behorde erstellt und wird dem Anmelder gemaB Artikel 36 ubermittelt. 



2. Dieser BERICHT umfaBt insgesamt 5 Blatter einschliefclich dieses Deckblatts. 

□ AuGerdem liegen dem Bericht ANLAGEN bei; dabei handelt es sich um Blatter mit Beschreibungen, Anspruchen 
und/oder Zeichnungen, die geandert wurden und diesem Bericht zugrunde liegen, und/oder Blatter mit vor dieser 
Behorde vorgenommenen Berichtigungen (siehe Regel 70.16 und Abschnitt 607 der Verwaltungsrichtlinien zum PCT). 

Diese Anlagen umfassen insgesamt Blatter. 



3. Dieser Bericht enthait Angaben zu foigenden Punkten: 



I 


IS 


Grundlage des Berichts 


It 


□ 


Prioritat 


III 


□ 


Keine Erstellung eines Gutachtens uber Neuheit, erfinderische Tatigkeit und gewerbliche Anwendbarkeit 


IV 


□ 


Mangelnde Einheitlichkeit der Erfindung 


V 




Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erfinderischen Tatigkeit und der 
gewerblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 


VI 


□ 


Bestimmte angefuhrte Unterlagen 


VII 


□ 


Bestimmte Mangel der intemationalen Anmeldung 


VIII 




Bestimmte Bemerkungen zur intemationalen Anmeldung 



Datum der Ein retch ung des Antrags 
19/04/2000 


Datum der Fertigstellung dieses Berichts 
31.01.2001 


Name und Postanschrift der mit der intemationalen vorlaufigen 
Prufung beauftragten Behorde: 

Europaisches Patentamt 

/ml D-80298 Munchen 

Tel. +49 89 2399 - 0 Tx: 523656 epmu d 

Fax:+49 89 2399-4465 
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INTERNATIONALER VORLAUFIGER 

PRUFUNGSBERICHT Internationales Aktenzeichen PCT/EP99/07952 



I. Grundlage des B richts 

1 . Dieser Bericht wurde erstellt auf der Grundlage (Ersatzblatter, die dem Anmeldeamt auf erne Aufforderung nach 
Artikel 14 hin vorgelegt wurden, gelten im Rahmen dieses Berichts als "ursprunglich eingereicht" und sind ihm 
nicht beigefugt, weii sie keine Anderungen enthalten.): 
Beschreibung, Seiten: 

1-108 ursprungliche Fassung 

Patentanspriiche, Nr.: 

1-16 ursprungliche Fassung 

Zeichnungen, Blatter: 

1/3-3/3 ursprungliche Fassung 

Sequenzprotokoll in der Beschreibung, Seiten: 

1-75, in der ursprunglich eingereichten Fassung. 



2. Hinsichtlich der Sprache: Alle vorstehend genannten Bestandteile standen der Behorde in der Sprache, in der 
die internationale Anmeldung eingereicht worden ist, zur Verfugung oder wurden in dieser eingereicht, sofern 
unter diesem Punkt nichts anderes angegeben ist. 

Die Bestandteile standen der Behorde in der Sprache: zur Verfugung bzw. wurden in dieser Sprache 
eingereicht; dabei handelt es sich um 

□ die Sprache der Ubersetzung, die fur die Zwecke der internationalen Recherche eingereicht worden ist (nach 
Regel 23.1(b)). 

□ die Veroffentlichungssprache der internationalen Anmeldung (nach Regel 48.3(b)). 

□ die Sprache der Ubersetzung, die fur die Zwecke der internationalen vorlaufigen Prufung eingereicht worden 
ist (nach Regel 55.2 und/oder 55.3). 

3. Hinsichtlich der in der internationalen Anmeldung offenbarten Nucleotid- und/oder Aminosauresequenz ist die 
internationale vorlaufige Prufung auf der Grundlage des Sequenzprotokolls durchgefuhrt worden, das: 

in der internationalen Anmeldung in schriftlicher Form enthalten ist. 
H zusammen mit der internationalen Anmeldung in computerlesbarer Form eingereicht worden ist. 

□ bei der Behorde nachtraglich in schriftlicher Form eingereicht worden ist. 

□ bei der Behorde nachtraglich in computerlesbarer Form eingereicht worden ist. 

□ Die Erklarung, da(3 das nachtraglich eingereichte schriftliche Sequenzprotokoll nicht uber den 
Offenbarungsgehalt der internationalen Anmeldung im Anmeldezeitpunkt hinausgeht, wurde vorgelegt. 

□ Die Erklarung, daB die in computerlesbarer Form erfassten Informationen dem schriftlichen 
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Sequenzprotokoll entsprechen, wurde vorgelegt. 

4. Aufgrund der Anderungen sind folgende Unterlagen fortgefallen: 

□ Beschreibung, Seiten: 

□ Anspruche, Nr.: 

□ Zeichnungen, Blatt: 

5. □ Dieser Bericht ist ohne Berucksichtigung (von einigen) der Anderungen erstellt worden, da diese aus den 

angegebenen Grunden nach Auffassung der Behdrde uber den Offenbarungsgehalt in der ursprunglich 
eingereichten Fassung hinausgehen (Regel 70.2(c)). 

(Auf Ersatzblatter, die solche Anderungen enthalten, ist unter Punkt 1 hinzuweisen;sie sind diesem Bericht 
beizufugen). 



6. Etwaige zusatzliche Bemerkungen: 



V. Begrundete Feststellung nach Art ike I 35(2) hinsichtlich der Neuheit, der erfinderischen Tatigkeit und der 
gewerblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 

1. Feststellung 

Neuheit (N) Ja: Anspruche 2,7-10,14 

Nein: Anspruche 1, 3-6, 11-13, 15-16 

Erfinderische Tatigkeit (ET) Ja: Anspruche 

Nein: Anspruche 1-16 

Gewerbliche Anwendbarkeit (GA) Ja: Anspruche 1-16 

Nein: Anspruche 



2. Unterlagen und Erklarungen 
siehe Beiblatt 



VIII. Bestimmte Bemerkungen zur internationalen Anmeldung 

Zur Klarheit der Patentanspruche, der Beschreibung und der Zeichnungen Oder zu der Frage, ob die Anspruche 
in vollem Umfang durch die Beschreibung gestutzt werden, istfolgendes zu bemerken: 
siehe Beiblatt 
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Zu Punkt V 

Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der 
erfinderischen Tatigkeit und der gewerblichen Anwendbarkeit; Unterlagen und 
Erklarungen zur Stutzung dieser Feststellung 

Es wird auf das folgende Dokument verwiesen: 

D1: EP 0 845 532 A 



1) Neuheit : 

- D1 offenbart die Enzyme von Pseudomonas sp. HR 199, die verantwortlich fur den 
Abbau von Eugenol sind, und ihre Gensequenzen (Fig. 1; SEQ ID NOS: 1-42). Zwei 
verschiedene Strategien wurden fur ihre Charakterisierung benutzt. Entweder wurden 
Mutanten dieses Stammes mittels Nitroguanidin isoliert und bezuglich ihres 
Vermogens, Eugenol, Ferulasaure und Vanillin als C- und Energiequelle nutzen zu 
konnen, klassifiziert (S. 7, Beispiel 1). Zum Beispiel wurde gezeigt, daB die Mutante 
6164, die nicht mehr in der Lage war, Eugenol zu nutzen aber wie der Wildtyp, 
Ferulasaure und Vanillin zu verwerten vermochte, mit dem Coniferylalkohol- 
Dehydrogenase (CADH) Gen komplementiert werden konnte (S. 8, Beispiel 5). Dieses 
Gen wurde weiter identifiziert durch die Reinigung des Enzymes CADH, die 
Bestimmung seiner N-terminalen Aminosauresequenz und die Ausbildung einer 
Gensonde, die mit dem isolierten Gen hybridisieren konnte (S. 9, Beispiel 6). 

- Der Gegenstand der Anspruche 1, 3-6, 11-13 und 15-16 wird durch das in D1 
offenbarte Verfahren vorweggenommen. Aus diesem Grund erfullen die Anspruche 1, 
3-6, 11-13 und 15-16 nicht die Erfordernisse des Artikels 33(2) PCT 

2) Erfinderische Tatigkeit : 

- Das in D1 offenbarte Verfahren nimmt den Gegenstand der vorliegenden Anmeldung 
vorweg. 
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- Der einzige Unterschied zu D1 ist, daB die Gene mittels gentechnischer Methoden 
(Insertion Oder Deletion) inaktiviert wurden (Anspruche 2, 7-10 und 14), und nicht 
mittels chemischer Mutagenese. Dieses technische Merkmal ist nicht erfinderisch, weil 
es dem Fachmann wohlbekannt ist. 

- Der Gegenstand der Anspruche 2, 7-10 und 14 beruht somit nicht auf einer 
erfinderischen Tatigkeit und erfullt damit nicht das in Artikel 33(3) PCT genannte 
Kriterium. 

Zu Punkt VIII 

Bestimmte Bemerkungen zur internationalen Anmeldung 

1) Die vorliegende Anmeldung zeigt, daB dieses Verfahren mit dem Bakterium 
Pseudomonas funktioniert. Es gibt aber keine Grundlage oder kein Beispiel fur einen 
anderen einzelligen Organismus und, um so mehr, fur einen "mehrzelligen 
Organismus". Aus diesem Grund ist Anspruch 1 nicht ausreichend gestutzt und erfullt 
somit nicht die Erfordernisse des Artikels 6 PCT. 

2) Anspruch 1 muB ausdrucklich auf nicht-menschliche Tiere beschrankt werden. 

3) Es sieht so aus, daB Anspruche 7 und 8 von Anspruch 6 abhangen sollten. 

4) Das Wort "vorzugsweise" oder "insbesondere" fuhrt nur eine bevorzugte Variante 
ein. Das limitiert den Umgang der Anspruche 4-5 und 12 aber nicht. 

5) In Anspruch 7 sollten die Gen-Strukturen nicht mit einer Referenz zur Abbildung 
sondern mit technischen Merkmalen definiert werden. 

6) Die Gen-Strukturen in Anspruch 8 sollten nicht mit Referenz zur Abbildung sondern 
zur Sequenz definiert werden. 
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(57) Abstract 

The invention relates to a transformed and/or mutagenated unicellular or multicellular organism which is characterized in that enzymes 
of the eugenol and/or ferulic acid catabolism are deactivated in such a manner that the intermediates coniferyl alcohol, coniferyl aldehyde, 
ferulic acid, vanillin and/or vanillinic acid are accumulated. 



(57) Zusammenfassung 

Die vorliegende Erfindung betrifft einen transformierten und/oder mutagenisierten ein- oder mehrzelligen Organismus, der dadurch 
gekennzeichnet ist, daB Enzyme des Eugenol- und/oder Ferulasaure-Katabolismus derart inaktiviert sind, daB eine Akkumulation der 
Intermediate Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin und/oder Vanillinsaure erfolgt 



//A J 9? 



1 



LEDIGUCH ZUR INFORMATION 

Codes zur Identifizierung von PCT-Vertragsstaaten auf den Kopfbbgen der Schriften, die Internationale Anmeldungen gemass den^M 
PCT veroffentlichen. 



AL 


Albanien 


ES 


Spanien 


LS 


Lesotho 


SI 


Slowenien 


AM 


Armenien 


FI 


Finn J and 


UT 


Litaucn 


SK 


Slowakei 


AT 


Osterreich 


FR 


Frankreich 


UU 


Luxemburg 


SN 


Senegal 


AU 


AustraSten 


GA 


Gabun 


LV 


Letiland 


sz 


SwasUand 


AZ 


Aserbaidschan 


GB 


Vcrcinigtcs Konigrcicb 


MC 


Monaco 


TD 


Tschad 


BA 


Bosnien -Hcrzcgowma 


GE 


Georgien 


MD 


Rcpublik Moldau 


TG 


Togo 


BB 


Barbados 


GH 


Ghana 


MG 


Madagaskar 


TJ 


Tadschiktslan 


BE 


Bclgtcn 


GN 


Guinea 


MK 


Die ehemalige jugoslawische 


TM 


Turkmenistan 


BK 


Burkina Faso 


GR 


Gricchcnland 




Rcpublik Mazedonien 


TR 


TQrkei 


BG 


Bulgaricn 


HU 


Ungam 


ML 


Mali 


TT 


Trinidad und Tobago 


Bj 




IE 


Irland 


MN 


Mongolei 


UA 


Ukraine 


BR 


Brasiiicn 


IL 


Israel 


MR 


Maurctanien 


UG 


Uganda 


BY 


Belarus 


IS 


Island 


MW 


Malawi 


US 


Vereinigte Scaaten von 


CA 


Kanada 


IT 


It alien 


MX 


Mexiko 




Amerika 


CF 


Zemratafrikamschc Kcpubltk 


JP 


Japan 


NE 


Niger 


UZ 


Uzbekistan 


CG 


Kongo 


KE 


Kenta 


NL 


Ntcderiande 


VN 


Vietnam 


CH 


Schwctz 


KG 


Ktrgisistan 


NO 


Norwegen 


YU 


Jugoslawien 


C! 


Cote d* I voire 


KP 


Demoknj ische Volksrepublik 


NZ 


rJeusceUnd 


ZW 


Zimbabwe 


CM 


Kamerun 




Korea 


PL 


Polen 






CN 


China 


KR 


Rcpublik Korea 


PT 


Portugal 






CU 


Kuba 


KZ 


Kasachstan 


RO 


RumJnicn 






CZ 


Tschectiischc Rcpublik 


LC 


Si. Lucia 


RU 


Russische Federation 






DE 


Deutschland 


LI 


Liechtenstein 


SO 


Sudan 






DK 


DSncmark 


LK 


Sri Lanka 


SE 


Schweden 






KK 


Hslland 


LR 


Liberia 


SC 


Smgapur 







WO 00/26355 PCT/EP99/07952 

Konstruktion von Produktionsstammen fur die Herstellung von substituierten 
Phenolen durch gezielte Inaktivierungen von Genen des Eugenol- und Ferula- 
saure-Katabolismus 

5 

Die vorliegende Erfindung betrifft die Konstruktion von Produktionsstammen und 
ein Verfahren fur die Herstellung substituierter Methoxyphenole, insbesondere 
Vanillin. 

10 Die DE-A 4 227 076 (Verfahren zur Herstellung substituierter Methoxyphenole und 
dafiir geeigneter Mikroorganismus) beschreibt die Herstellung substituierter 
Methoxyphenole mit einer neuen Pseudomonas sp.. Ausgangsmaterial ist hier Euge- 
nol und die Produkte sind Ferulasaure, Vanillinsaure, Coniferylalkohol und Coni- 
ferylaldehyd. 

15 

Ebenfalls 1995 erscheint ein umfangreiches Review iiber die Biotransformations- 
moglichkeiten mit Ferulasaure von Rosazza et aL (Biocatalytic transformation of 
ferulic acid: an abundant aromatic natural product; J. Ind. Microbiol. 15:457-471). 

20 Die Gene und Enzyme zur Synthese von Coniferylalkohol, Coniferylaldehyd, 
Ferulasaure, Vanillin und Vanillinsaure aus Pseudomonas sp. wurden in EP-A 
0 845 532 beschrieben. 

Die Enzyme zur Umsetzung von /T<my-Ferulasaure zu fra/iy-Feruloyl-SCoA Ester 
25 und weiter zum Vanillin, sowie das Gen fur die Spaltung des Esters wurden vom 
Institute of Food Research, Norwich, GB, in WO 97/35999 beschrieben. 1998 
erscheint der Inhalt des Patents auch als wissenschaftliche Publikationen (Gasson et 
al. 1998. Metabolism of ferulic acid to vanillin. J. Biol. Chem. 273:4163-4170; 
Narbad and Gasson 1998. Metabolism of ferulic acid via vanillin using a novel CoA- 
30 dependent pathway in a newly isolated strain of Pseudomonas Jluorescens. Micro- 
biology 144:1397 - 1405). - 
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Die DE-A 195 32 317 beschreibt die fermentative Gewinnung von Vanillin aus 
Ferulasaure mit Amycolatopsis sp. in hohen Ausbeuten. 

5 Die bekannten Verfahren haben den Nachteil, daB entweder nur sehr geringe Aus- 

beuten an Vanillin erzielt werden, oder von relativ teuren Edukten ausgegangen wird. 
Bei dem letztgenannten Verfahren (DE-A 195 32 317) werden zwar hohe Ausbeuten 
erzielt, jedoch bedingt der Einsatz von Pseudomonas sp. HR199 und Amycolatopsis 
sp. HR167 fur die Biotransformation von Eugenol zu Vanillin eine zweistufige 
1 0 Fermentationsfiihrung und somit einen erheblichen Kosten- und Zeitaufwand. 

Aufgabe der vorliegenden Erfindung ist es daher, Organismen zu konstruieren, die in 
der Lage sind den preiswerten Rohstoff Eugenol in einem einstufigen ProzeB zu 
Vanillin umzusetzen. 

15 

Diese Aufgabe wird durch die Konstruktion von Produktionsstammen ein- oder 
mehrzelliger Organismen gelost, die dadurch gekennzeichnet sind, dafi Enzyme des 
Eugenol- und/oder Ferulasaure-Katabolismus derart inaktiviert sind, daB eine Akku- 
mulation der Intermediate Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin 
20 und/oder Vanillinsaure erfolgt. 

Der Produktionsstamm kann einzellig oder mehrzellig sein. DemgemaB konnen 
Gegenstand der Erfindung Mikroorganismen, Pflanzen oder Tiere sein. Dariiber 
hinaus konnen auch Extrakte die aus dem Produktionsstamm gewonnen werden zum 

25 Einsatz kommen. ErfindungsgemaB werden vorzugsweise einzellige Organismen 

eingesetzt. Hierbei kann es sich urn Mikroorganismen, tierische oder pflanzliche 
Zellen handeln. Besonders bevorzugt ist erfindungsgemaB der Einsatz von Pilzen und 
Bakterien. Hochst bevorzugt sind Bakterienarten. Unter den Bakterien konnen insbe- 
sondere Rhodococcus- , Pseudomonas- und Escherichia-Ancn nach Veranderung des 

30 Eugenol- und/oder Fcrulasaurc-Kalabolismus zum Einsatz kommcn. 
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Die Gewinnung der erfindungsgemaB einsetzbaren Organismen kann im einfachsten 
Fall mittels bekannter, konventioneller mikrobiologischer Methoden erfolgen. So 
kann die Enzymaktivitat der am Eugenol- und/oder Ferulasaure-Katabolismus betei- 
ligten Proteine durch den Einsatz von Enzym-Hemmstoffen verandert werden. 
Daruber hinaus kann die Enzymaktivitat der am Eugenol- und/oder Ferulasaure- 
Katabolismus beteiligten Proteine durch Mutation der fur diese Proteine kodierenden 
Gene verandert werden. Derartige Mutationen konnen nach klassischen Methoden 
ungerichtet erzeugt werden, wie beispielsweise durch UV-Bestrahlung oder muta- 
tionsauslosende Chemikalien. 

Ebenso sind gentechnische Methoden zur Gewinnung der erfindungsgemafien Orga- 
nismen geeignet, wie Deletionen, Insertionen und/oder Nukleotid-Austausche. So 
konnen beispielsweise die Gene der Organismen mit Hilfe von anderen DNA-EJe- 
menten (Q-Elemente) inaktiviert werden. Ebenso konnen mittels geeigneter Vektoren 
Austausche der intakten Gene gegen veranderte und/oder inaktivierte Gen-Strukturen 
durchgefuhrt werden. Die zu inaktivierenden Gene und die fur die Inaktivierung ein- 
gesetzten DNA-Elemente konnen dabei durch klassische Klonierungstechniken oder 
durch Polymerase-Kettenreaktionen (PGR) gewonnen werden. 

In einer moglichen Ausgestaltung der Erfindung kann beispielsweise der Eugenol- 
sowie der Ferulasaure-Katabolismus durch 12-Element-Insertion oder Einfuhren von 
Deletionen in entsprechende Gene verandert werden. Hierbei konnen die Funktionen 
der Gene, die fur Dehydrogenasen, Synthetases Hydratasen-Aldolasen, Thiolasen 
oder Demethylasen kodieren, mittels der oben genannten gentechnischen Methoden 
inaktiviert werden, so dail die Erzeugung der betreffenden Enzyme blockiert ist. Vor- 
zugsweise handelt es sich um die Gene, die fur Coniferylalkohol-Dehydrogenasen, 
Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA-Synthetasen, Enoyl-CoA- 
Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydrogenasen oder Vanillin- 
saurc-Demethylasen kodieren. Ganz besonders bevorzugt sind Gene, die die in der 
EP-A 0845532 angegebenen Aminosauresequenzen kodieren und/oder deren Allel- 
variationen kodierenden Nukleotidsequenzen. 



WO 00/26355 



-4- 



PCT/EP99/07952 



Gegenstand der Erfindung sind demgemaB auch Gen-Strukturen zur Herstellung 
transformierter Organismen und Mutanten. 

5 Vorzugsweise werden Gen-Strukturen zur Gewinnung der Organismen und Mutanten 

eingesetzt, bei denen die fur Dehydrogenase^ Synthetasen, Hydratasen-Aldolasen, 
Thiolasen oder Demethylasen kodierenden Nukleotidsequenzen inaktiviert sind. 
Besonders bevorzugt sind Gen-Strukturen, bei dene die fur Coniferylalkohol- 
Dehydrogenasen, Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA-Synthetasen, 

1 0 Enoyl-CoA-Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydrogenasen 

oder Vanillinsaure-Demethylasen kodierenden Nukleotidsequenzen inaktiviert sind. 
Ganz besonders bevorzugt sind Gen-Strukturen, die die in den Figuren la bis lr 
angegebenen Strukturen mit den in den Figuren 2a bis 2r wiedergegebenen 
Nukleotidsequenzen und/oder deren Allelvariationen kodierenden Nukleotidsequen- 

1 5 zen aufweisen. Besonders bevorzugt sind hierbei Nukleotidsequenzen von 1 bis 1 8. 

Die Erfindung schlieBt auch die Teilsequenzen dieser Gen-Strukturen sowie funktio- 
nelle Aquivalente ein. Unter funktionellen Aquivalenten sind solche Derivate der 
DNA zu verstehen, bei denen einzelne Nukleobasen ausgetauscht worden sind 
20 (Wobbelaustausche), ohne die Funktion zu andern, Auch auf Proteinebene konnen 
Aminosauren ausgetauscht werden, ohne daB eine Veranderung der Funktion die 
Folge ist. 

Den Gen-Strukturen konnen ein oder mehrere DNA-Sequenzen vor- und/oder nach- 
25 geschaltet sein. Durch Klonierung der Gen-Strukturen sind Plasmide bzw. Vektoren 
erhaltlich, die zur Transformation und/oder Transfektion eines Organismus und/oder 
zur konjugativen Ubertragung in einen Organismus geeignct sind. 

Gegenstand der Erfindung sind ferner Plasmide und/oder Vektoren zur Herstellung 
30 der erfindungsgemaBen transformierten Organismen und Mutanten. Diese enthalten 
demgemaB die beschriebenen Gen-Strukturen. Die vorliegende Erfindung betrifft 
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demgemaB auch Organismen, die die genannten Plasmide und/oder Vektoren ent- 
halten. 

Die Art der Plasmide und/oder Vektoren hangt von deren Einsatzzweck ab. Um z. B. 
5 die intakten Gene des Eugenol- und/oder Ferulasaure-Katabolismus in Pseudomona- 
den gegen die durch Omega-Elernente inaktivierten Gene austauschen zu kdnnen, 
benotigt man Vektoren, die einerseits in Pseudomonaden ubertragen werden konnen 
(konjugativ iibertragbare Plasmide), andererseits dort jedoch nicht repliziert werden 
konnen und somit in Pseudomonaden instabil sind (sogenannte Suizid-Plasmide). 
10 DNA-Abschnitte, die mit Hilfe eines solchen Plasmidsystems in Pseudomonaden 
ubertragen werden, konnen nur erhalten bleiben, wenn sie durch homologe Rekom- 
bination in das Genom der Bakterienzelle integriert werden. 

Die beschriebenen Gen-Strukturen, Vektoren und Plasmide konnen zur Herstellung 
1 5 verschiedener transformierter Organismen oder Mutanten verwendet werden. Mittels 
der gennanten Gen-Strukturen konnen intakte Nukleinsauresequenzen gegen veran- 
derte und/oder inaktivierte Gen-Strukturen ausgetauscht werden. In den durch Trans- 
formation oder Transfektion oder Konjugation erhaltlichen Zellen erfolgt durch 
homologe Rekombination ein Austausch des intakten Gens gegen die veranderte 
20 und/oder inaktivierte Gen-Struktur, wodurch die resultierenden Zellen nur noch uber 
die veranderte und/oder inaktivierte Gen-Struktur im Genom verfugen. So konnen 
erfindungsgemaB vorzugsweise Gene derart verandert und/oder inaktiviert werden, 
daB die betreffenden Organismen Coniferylalkohol, Coniferylaldehyd, Ferulasaure, 
Vanillin und/oder Vanillinsaure zu erzeugen vermogen. 

25 

ErfindungsgemaB derart konstruicrte Produktionsstamme sind beispielsweise 
Mutanten des Stammes Pseudomonas sp. HR199 (DSM 7063) der in der DE-A 4 227 
076 und der EP-A 0845532 gcnau bcschrieben wurde, wobei sich unter anderem die 
cntsprcchenden Genstrukturen aus den Figuren la bis Ir in Verbindung mit den Figu- 
30 rcn 2a bis 2r ergeben: 



WO 00/26355 PCT/EP99/07952 

- 6 - 

1. Pseudomonas sp. HR199ea/v4QKm, enthaltend das durch QKm inaktivierte 
calA-Gen an Stelle des intakten ca/^4-Gens kodierend fur Coniferylalkohol- 
Dehydrogenase (Fig. la; Fig. 2a). 

2. Pseudomonas sp. HRl99calAClGm, enthaltend das durch flGm inaktivierte 
calA-Gen an Stelle des intakten eaM-Gens kodierend fur Coniferylalkohol- 
Dehydrogenase (Fig. lb; Fig. 2b). 

3. Pseudomonas sp. HRl99calAA y enthaltend das durch Deletion inaktivierte 
calA-Gen an Stelle des intakten calA-Gens kodierend fur Coniferylalkohol- 
Dehydrogenase (Fig. lc; Fig. 2c). 

4. Pseudomonas sp. HRI99ca/5QKm, enthaltend das durch QKm inaktivierte 
calB-Gen an Stelle des intakten ea/5-Gens kodierend fur Coniferylaldehyd- 
Dehydrogenase (Fig. Id; Fig. 2d) 

5. Pseudomonas sp. HR1 99ea/5QGm, enthaltend das durch QGm inaktivierte 
calB-Gen an Stelle des intakten calB-Gens kodierend fur Coniferylaldehyd- 
Dehydrogenase (Fig. le; Fig. 2e). 

6. Pseudomonas sp. HR199ea/#A, enthaltend das durch Deletion inaktivierte 
calB-Gen an Stelle des intakten calB-Gens kodierend fur Coniferylaldehyd- 
Dehydrogenase(Fig. 1 f; Fig. 2f). 

7. Pseudomonas sp. HR199/e.yQKjrn, enthaltend das durch QKm inaktivierte fcs- 
Gen an Stelle des intakten yes-Gens kodierend fur Ferulasaure-CoA-Synthe- 
tase(Fig.lg; Fig. 2g). 

8. Pseudomonas sp. HR1 99/csQGm, enthaltend das durch QGm inaktivierte fcs- 
Gen an Stelle des intakten yes-Gens kodierend fur Ferulasaure-CoA-Synthe- 
tase (Fig.lh; Fig. 2h). 

9. Pseudomonas sp. HR199/c^A, enthaltend das durch Deletion inaktivierte fes- 
Gen an Stelle des intakten yes-Gens kodierend fur Ferulasaure-CoA-Synthe- 
tase (Fig.li; Fig. 2i). 

10. Pseudomonas sp. HR199ee/7QKm, enthaltend das durch QKm inaktivierte 
ee/7-Gen an Stelle des intakten ee/?-Gcns kodierend fur Enoyl-CoA- 
Hydratase-Aldolasc (Fig.lj; Fig. 2j). 
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11. Pseudomonas sp. HR199ec/*QGm, enthaltend das durch QGm inaktivierte 
ech-Gen an Stelle des intakten ecA-Gens kodierend fur Enoyl-CoA-Hydra- 
tase-Aldolase (Fig. Ik; Fig. 2k). 

12. Pseudomonas sp. HR1 99echA, enthaltend das durch Deletion inaktivierte ech- 
5 Gen an Stelie des intakten ec/i-Gens kodierend fur Enoyl-CoA-Hydratase- 

Aldolase(FLll; Fig. 21). 

13. Pseudomonas sp. HR199atf/QKrn, enthaltend das durch QKm inaktivierte 
aat-Gen an Stelle des intakten aa(-Gens kodierend fur beta-Ketothiolase 
(Fig. lm; Fig. 2m). 

10 14. Pseudomonas sp. HR199<3tf/QGm > enthaltend das durch QGm inaktivierte 

aat-Gen an Stelle des intakten aa/-Gens kodierend fur beta-Ketothiolase 
(Fig. In; Fig. 2n). 

15. Pseudomonas sp. HR199a<2/A, enthaltend das durch Deletion inaktivierte aat- 
Gen an Stelle des intakten aa/-Gens kodierend fur beta-Ketothiolase (Fig.Io; 

15 2o). 

16. Pseudomonas sp. HR199v<#zQKm, enthaltend das durch QKm inaktivierte 
vdh-Gen an Stelle des intakten vdh-Gens kodierend fur Vanillin-Dehydroge- 
nase (Fig.lp; Fig. 2p). 

17. Pseudomonas sp. HR199w//zQGm 5 enthaltend das durch QGm inaktivierte 
20 vdh-Gen an Stelle des intakten vdh-Gcns kodierend flir Vanillin-Dehydroge- 

nase (Fig.lq; Fig. 2q). 

18. Pseudomonas sp. HR\99vdhA, enthaltend das durch Deletion inaktivierte 
vdh-Gen an Stelle des intakten vdh-Gens kodierend ftir Vanillin-Dehydroge- 
nase (Fig.Ir; Fig. 2r). 

25 19. Pseudomonas sp. HR\99vdhB€lKm, enthaltend das durch QKm inaktivierte 

vdhB-Gen an Stelle des intakten vdhB-Gens kodierend fur Vanillin-Dchydro- 
genase II.. 

20. Pseudomonas sp. HR199vrf/iBQGm, enthaltend das durch QGm inaktivierte 
vdhB-Gen an Stelle des intakten vdhB-Gens kodierend flir Vanillin-Dehydro- 
30 genase II. 
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21. Pseudomonas sp. HR199w//lBA, enthaltend das durch Deletion inaktivierte 
vdhB-Gen an Stelle des intakten vdhB-Gens kodierend fur Vanillin-Dehydro- 
genase II. 

22. Pseudomonas sp. HR199a^QKm, enthaltend das durch QKm inaktivierte 
adh-Gen an Stelle des intakten adh-Gzns kodierend flir Alkohol-Dehydroge- 
nase. 

23. Pseudomonas sp. HR\99adhClGm J enthaltend das durch QGm inaktivierte 
adh-Gen an Stelle des intakten arf/z-Gens kodierend fur Alkohol-Dehydroge- 
nase. 

24. Pseudomonas sp. HRl99adhA enthaltend das durch Deletion inaktivierte adh- 
Gen an Stelle des intakten adh-Gens kodierend flir Alkohol-Dehydrogenase. 

25. Pseudomonas sp. HR\99vanA€lKm, enthaltend das durch QKm inaktivierte 
vanA-Gen an Stelle des intakten vanA-Gtns kodierend fur die ct-Untereinheit 
der Vanillinsaure-Demethylase. 

26. Pseudomonas sp. HR199va«^QGm, enthaltend das durch QGm inaktivierte 
vanA-Gen an Stelle des intakten vanA-Gens kodierend fur die a-Untereinheit 
der Vanillinsaure-Demethylase. 

27. Pseudomonas sp. HR\99vanAA, enthaltend das durch Deletion inaktivierte 
vanA-Gen an Stelle des intakten va«y4-Gens kodierend flir die a-Untereinheit 
der Vanillinsaure-Demethylase. 

28. Pseudomonas sp. HR199va/?£QKm, enthaltend das durch QKm inaktivierte 
vanB-Gen an Stelle des intakten vanB-Gens kodierend flir die p-Untereinheit 
der Vanillinsaure-Demethylase. 

29. Pseudomonas sp. HR199v*m£QGm, enthaltend das durch Q.Gm inaktivierte 
vanB-Gen an Stelle des intakten vaw5-Gens kodierend fur die p-Untereinheit 
der Vanillinsaure-Demethylase. 

30. Pseudomonas sp. HR199vtf«i?A, enthaltend das durch Deletion inaktivierte 
va/?Z?-Gen an Stelle des intakten vaw£-Gens kodierend fur die p-Untereinheit 
der Vanillinsaure-Demethylase. 



WO 00/26355 



-9- 



PCT/EP99/07952 



Gegenstand der Erfindung ist auBerdem ein Verfahren zur biotechnischen Herstel- 
lung von organischen Verbindungen. Insbesondere konnen mit diesem Verfahren 
Alkohole, Aldehyde und organische Sauren hergestellt werden. Vorzugsweise han- 
delt es sich hierbei um Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin und 
5 Vanillinsaure. 



In dem erfindungsgemaBen Verfahren werden die oben beschriebenen Organismen 
eingesetzt. Zu den ganz besonders bevorzugten Organismen gehoren Bakterien, ins- 
besondere die Pseudomonas-ArXen. Im einzelnen konnen die oben genannten Pseu- 
10 domonas-Artcn vorzugsweise fur folgende Verfahren eingesetzt werden: 



1. Pseudomonas sp. HR1 99calAClKm, Pseudomonas sp. HR\99calAQGm und 
Pseudomonas sp. HR199c#A4A zur Herstellung von Coniferylalkohol aus 
Eugenol. 

15 

2. Pseudomonas sp. HR199ca/i?QKm, Pseudomonas sp. HR199ca/BQGm und 
Pseudomonas sp. HR199ca/SA zur Herstellung von Coniferylaldehyd aus 
Eugenol oder Coniferylalkohol. 

20 3. Pseudomonas sp. HR199/crQKm, Pseudomonas sp. HR199/crfX}m, Pseu- 
domonas sp. HR199fcsA, Pseudomonas sp. HR199£c/?QKm, Pseudomonas 
sp. HR199ecM2Gm und Pseudomonas sp. HR199ec/zA zur Herstellung von 
Ferulasaure aus Eugenol oder Coniferylalkohol oder Coniferylaldehyd. 

25 4. Pseudomonas sp. HR199w#zQKm, Pseudomonas sp. HR199v<#zQGm, Pseu- 
domonas sp. UR\99vdhA, Pseudomonas sp. HR199vJ/zQGmv<//z£QKm, 
Pseudomonas sp. HR199vrfAQKmv<#?Z?QGm, Pseudomonas sp. 
HR199v£//7Av<#?Z?QGm und Pseudomonas sp. HR199w//?AvJASQKm zur 
Herstellung von Vanillin aus Eugenol oder Coniferylalkohol oder Coni- 

30 ferylaldehyd oder Ferulasaure. 
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5. Pseudomonas sp. HR199vtfW/4f}Km, Pseudomonas sp. HR\99vanA£lGm, 
Pseudomonas sp. HR199van^A, Pseudomonas sp. HR1 99 vanBQKm, 
Pseudomonas sp. HR199va«Z?QGm und Pseudomonas sp. HKl99vanBA zur 
Herstellung von Vanillinsaure aus Eugenol oder Coniferylalkohol oder 
Coniferylaldehyd oder Ferulasaure oder Vanillin. 

Bevorzugtes Substrat ist Eugenol. Jedoch kann der Zusatz weiterer Substrate oder 
sogar der Austausch des Eugenol gegen ein anderes Substrat moglich sein. 

Als Nahrmedium fur die erfindungsgemafi eingesetzten Organismen kommen syn- 
thetische, halbsynthetische oder komplexe Kulturmedien in Betracht. Diese konnen 
kohlenstoffhaltige und stickstoffhaltige Verbindungen, anorganische Salze, gegebe- 
nenfalls Spurenelemente sowie Vitamine enthalten. 

Als kohlenstoffhaltige Verbindungen konnen Kohlenhydrate, Kohlenwasserstoffe 
oder organische Grundchemikalien in Betracht kommen. Beispiele fur vorzugsweise 
verwendbare Verbindungen sind Zucker, Alkohole bzw. Zuckeralkohole, organische 
Sauren oder komplexe Gemische. 

Als Zucker kommt vorzugsweise Glucose in Betracht. Als organische Sauren konnen 
vorzugsweise Zitronensaure oder Essigsaure zum Einsatz kommen. Zu den kom- 
plexen Gemischen zahlen z. B. Malzextrakt, Hefeextrakt, Casein oder Caseinhydro- 
lysat. 

Als stickstoffhaltige Substrate kommen anorganische Verbindungen in Betracht. Bei- 
spiele hierfur sind Nitrate und Ammoniumsalze. Ebenso konnen organische Stick- 
stoffquellen zum Einsatz kommen. Hierzu zahlen Hefeexirakt, SojamehK Casein, 
Caseinhydrolysat und Maisquellwasser. 
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Zu den einsetzbaren anorganischen Salzen zahlen beispielsweise Sulfate, Nitrate, 
Chloride, Carbonate und Phosphate. Als Metalle enthalten die genannte Salze vor- 
zugsweise Natrium, Kalium, Magnesium, Mangan, Calcium, Zink und Eisen. 

Die Temperatur fur die Kultivierung liegt vorzugsweise im Bereich von 5 bis 100°C. 
Besonders bevorzugt ist der Bereich von 15 bis 60°C, hochst bevorzugt sind 22 bis 
37°C. 

Der pH-Wert des Mediums betragt bevorzugt 2 bis 12. Besonders bevorzugt ist der 
Bereich von 4 bis 8. 

Grundsatzlich konnen fur die Durchfuhrung des erfindungsgemaBen Verfahrens alle 
dem Fachmann bekannten Bioreaktoren eingesetzt werden. Vorzugsweise kommen 
alle fur Submersverfahren geeigneten Vorrichtungen in Betracht. Das heiBt, es 
konnen erfindungsgemaB GefaCe ohne oder mit mechanischer Mischeinrichtung ein- 
gesetzt werden. Zu ersteren zahlen z. B. Schuttelapparaturen, Blasensaulen- oder 
Schlaufenreaktoren. Zu letzteren gehoren vorzugsweise alle bekannten Vorrichtun- 
gen mit Ruhrern in beliebiger Gestaltung. 

Das erfindungsgemaBe Verfahren kann kontinuierlich oder diskontinuierlich durch- 
gefiihrt werden. Die Dauer der Fermentation bis zum Erreichen einer maximalen 
Produktmenge hangt von der speziellen Art des eingesetzten Organismus ab. Grund- 
satzlich liegen die Zeiten der Fermentation jedoch zwischen 2 und 200 Stunden. 

Im folgenden wird die Erfindung unter Bezugnahme auf Beispiele naher erlautert: 

Von dem Eugenol verwertenden Stamm Pseudomonas sp. HR199 (DSM 7063) wur- 
den gezielt Mutanten crzeugt, wobei spezifisch Gene des Eugenol-Katabolismus 
durch Insertion von Omega-Elcmenten oder durch Einfuhren von Deletionen inakti- 
viert wurden. Als Omega-Elemente dicnten DNA-Abschnine die fiir Anlibiotika- 
resistenzen gegen Kanamycin (QKm) und Gentamycin (QGm) cbdie'rten. Diese 
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Resistenzgene wurden ausgehend von TnJ und dem Plasmid pBBRlMCS-5 mit 
Hilfe von Standardmethoden isoliert. Die Gene calA y calB^fcs, ech y aal y vdh, adh y 
vdhB y vanA und vanB, die fur Coniferylalkohol-Dehydrogenase, Coniferylaldehyd- 
Dehydrogenase, Ferulasaure-CoA Synthetase, Enoyl-CoA Hydratase-Aldolase, beta- 

5 Ketothiolase, Vanillin-Dehydrogenase, Alkohol-Dehydrogenase, Vanillin-Dehydro- 

genase II und Vanillinsaure-Demethylase codieren wurden ausgehend von genomi- 
scher DNA des Stammes Pseudomonas sp. HR199 mit Hilfe von Standardmethoden 
isoliert und in pBluescript SK" kloniert. Aus diesen Genen wurden durch Verdauung 
mit geeigneten Restriktionsendonukleasen DNA-Abschnitte entfernt (Deletion), bzw 

10 durch Q-Elemente substituiert (Insertion), wodurch das jeweilige Gen inaktiviert 

wurde. Die auf diese Weise rnutierten Gene wurden in konjugativ iibertragbare Vek- 
toren umkloniert und anschlieBend in den Stamm Pseudomonas sp. HR199 einge- 
fuhrt. Durch geeignete Selektion wurden Transkonjuganten erhalten, die das jeweils 
funktionsfahige wildtyp-Gen gegen das neu eingebrachte inaktivierte Gen ausge- 

1 5 tauscht hatten. Die so erhaltenen Insertions- und Deletionsmutanten wiesen nur noch 

das jeweils inaktivierte Gen auf. Auf diese Weise wurden sowohl Mutanten mit nur 
einem defekten Gen als auch Mehrfachmutanten, in denen mehrere Gene auf diese 
Weise inaktiviert wurden, erhalten. Diese Mutanten wurden fur die Biotransforma- 
tion von 

20 a) Eugenol zu Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin und/oder 
Vanillinsaure; 

b) Coniferylalkohol zu Coniferylaldehyd, Ferulasaure, Vanillin und/oder 
Vanillinsaure; 

c) Coniferylaldehyd zu Ferulasaure, Vanillin und/oder Vanillinsaure; 
25 d) Ferulasaure zu Vanillin und/oder Vanillinsaure und 

e) Vanillin zu Vanillinsaure eingesetzt. 
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Material und Methoden 
Wachstumsbedingungen der Bakterien. 

Stamme von Escherichia coli wurden bei 37°C in Luria-Bertani (LB) oder M9-Mine- 
5 ralmedium (Sambrook, J., E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a 
laboratory manual. 2. AufL, Cold Spring Harbor Laboratory Press, Cold Spring 
Harbor, New York.) angezogen. Stamme von Pseudomonas sp. wurden bei 30°C in 
Nutrient Broth (NB, 0,8%, wt/vol) oder in Mineralmedium (MM) (Schlegel, H. G. et 
al. 1961. Arch. Mikrobiol. 38:209-222) bzw. HR-Mineralmedium (HR-MM) 
10 (Rabenhorst, J. 1996. Appl. Microbiol. Biotechnol. 46:470-474.) angezogen. Ferula- 
saure, Vanillin, Vanillinsaure und Protocatechusaure wurden* in Dimethylsulfoxid 
gelost, und dem jeweiligen Medium in einer Endkonzentration von 0.1% (wt/vol) 
zugesetzt. Eugenol wurde dem Medium direkt in einer Endkonzentration von 0.1% 
(vol/vol) zugesetzt, bzw. in den Deckel von MM-Agarplatten auf Filterpapier 
15 (Rundfilter 595, Schleicher & SchuelL Dassel, Deutschland) appliziert. Bei der 
Anzucht von Transkonjuganten und Mutanten von Pseudomonas sp. wurde Tetra- 
cyclic Kanamycin, und Gentamycin in Endkonzentrationen von 25 |ig/ml bzw. 100 
jig/ml bzw. 7,5 Hg/ml eingesetzt. 

20 Qualitativer und quantitativer Nachweis von Stoffwechselintcrmediaten in Kul- 
turuberstanden. 

Kulturiiberstande wurden direkt, bzw. nach Verdunnung mit H20-bidest. mittels 
Hochdruck-Flussigkeits-Chroroatographie (Knauer-HPLC) analysiert. Die Chroma- 
tographic erfolgte an Nucleosil-100 CI 8 (7 ^m, 250 x 4 mm). Als Losungsmittel 
25 diente 0.1% (vol/vol) Ameisensaure und Acetonitril. Der verwendete Gradient zur 
Elution der Substanzen verlief wie folgt: 

00:00 - 06:30 -> 26% Acetonitril 
06:30 - 08:00 -> 100% Acetonitril 
30 08:00 - 12:00 -> 100% Acetonitril 
12:00 - 13:00 -> 26% Acetonitril 

1 3:00 - 1 8:00 26% Acetonitril * 
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Reinigung der Vanillin-Dehydrogenase-IL 

Die Aufreinigung erfolgte bei 4°C. 

Rohextrakt. 

Auf Eugenol angezogene Zellen von Pseudomonas sp. HR199 wurden in 10 mM 
Natriumphosphat-Puffer, pH 6.0 gewaschen, im gleichen Puffer resuspendiert und 
durch zweimalige Passage einer French-Presse (Amicon, Silver Spring, Maryland, 
USA) bei einem Druck von 1000 psi aufgeschlossen. Das Zellhomogenat wurde 
einer Ultrazentrifugation (1 h, 100 000 x g, 4°C) unterzogen, wodurch die losliche 
Fraktion des Rohextraktes als Oberstand erhalten wurde. 

Anionenaustauschchromatographie an DEAE-SephaceL 

Die losliche Fraktion des Rohextraktes wurde uber Nacht gegen 10 mM Natrium- 
phosphat-Puffer, pH 6.0 dialysiert. Das Dialysat wurde auf eine mit 10 mM 
Natriumphosphat-Puffer, pH 6.0 aquilibrierte DEAE-Sephacel-Saule (2,6 cm x 35 
cm, Bettvolumen[BV]: 186 ml) mit einer DurchfluBrate von 0.8 ml/min aufgetragen. 
Die Saule wurde mit zwei BV 10 mM Natriumphosphat-Puffer, pH 6.0 gespult. Die 
Elution der Vanillin-Dehydrogenase-II (VDH-II) erfolgte mit einem linearen Salz- 
gradient von 0 bis 400 mM NaCl in 10 mM Natriumphosphat-Puffer, pH 6.0 (750 
ml). Es wurden 10 ml-Fraktionen aufgefangen. Fraktionen mit hoher VDH-II-Akti- 
vitat wurden zum DEAE-Pool vereinigt. 

Bestimmung der Vanillin-Dehydrogenase-Aktivitat. 

Die Bestimmung der VDH-Aktivitat erfolgte bei 30°C durch einen optisch enzyma- 
tischen Test, Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0.1 mmol 
Kalium-Phosphal (pH 7.1), 0.125 nmol Vanillin, 0.5 jimol NAD, 1.2 nmol Pyruvat 
(Na-Salz), Lactat-Dehydrogenase (1 U; aus Schweineherz ) und Enzymlosung. Die 
Oxidation von Vanillin wurde bei X = 340 nm verfolgt (^vanillin " H,6 cm 2 /^mol). 
Die Enzymaktivitiit wurde in Einheilen (U) angegeben, wobei 1 U der Enzymmenge 
entspricht, die 1 ^imol Vanillin pro Minute umsctzt. Die Proteinkonzentrationen in 
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den Proben wurden nach Lowry et al. (Lowry, O. H., N. J. Rosebrough, A. L. Farr 
und R. J. Randall. 1951. J. Biol. Chem. 193:265-275) bestimmt. 

Bestimmung der Coniferylalkohol-Dehydrogenasc-Aktivitat. 

5 Die Bestimmung der CADH-Aktivitat erfolgte bei 30°C durch einen optisch enzy- 
matischen Test nach Jaeger et al. (Jaeger, E., L. Eggeling und H. Sahm. 1981. 
Current Microbiology. 6:333-336). Der Reaktionsansatz mit einem Volumen von 
1 ml enthielt 0.2 mmol Tris/HCl (pH 9.0), 0.4 fimol Coniferylalkohol, 2 pmol NAD, 
0.1 mmol Semicarbazid und Enzymlosung. Die Reduktion von NAD wurde bei X = 

10 340 nm verfolgt (s = 6.3 cm 2 /pmol). Die Enzymaktivitat wurde in Einheiten (U) 
angegeben, wobei 1 U der Enzymmenge entspricht, die 1 (imol Substrat pro Minute 
umsetzt. Die Proteinkonzentrationen in den Proben wurden nach Lowry et al. 
(Lowry, O. H., N. J. Rosebrough, A. L. Farr und R. J. Randall. 1951. J. Biol. Chem. 
193:265-275) bestimmt. 

15 

Bestimmung der Coniferylaldehyd-Dehydrogenase-Aktivitat. 

Die Bestimmung der CALDH-Aktivitat erfolgte bei 30°C durch einen optisch enzy- 
matischen Test, Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0.1 mmol 
Tris/HCl (pH 8.8), 0.08 pmol Coniferylaldehyd, 2.7 pmol NAD und Enzymlosung. 

20 Die Oxidation von Coniferylaldehyd zu Ferulasaure wurde bei X = 400 nm verfolgt 
(e = 34 cm^/fimol). Die Enzymaktivitat wurde in Einheiten (U) angegeben, wobei 1 
U der Enzymmenge entspricht, die 1 jimol Substrat pro Minute umsetzt. Die Pro- 
teinkonzentrationen in den Proben wurden nach Lowry et al. (Lowry, O. H., N. J. 
Rosebrough, A. L. Farr und R. J. Randall. 1951. J. Biol. Chem. 193:265-275) 

25 bestimmt. 

Bestimmung der Fcrulasaurc-CoA-Synthetase (Ferulasaure-Thiokinasc)-Aktivi- 
tat. 

Die Bestimmung der FCS-Aktivitat erfolgte bei 30°C durch einen optisch enzyma- 
30 tischen Test, modifiziert nach Zenk et al. (Zenk et al. 1980. Anal. Biochem. 101:182- 
187). Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0.09 mmol Kalium- 
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Phosphat (pH 7.0), 2.1 ^imol MgCl2, 0.7 ^imol Ferulasaure, 2 jimol ATP, 0.4 nmol 
Coenzym A und Enzymlosung. Die Entstehung des CoA-Esters aus Ferulasaure 
wurde bei X = 345 nm verfolgt (s = 10 cm 2 /jimol). Die Enzymaktivitat wurde in 
Einheiten (U) angegeben, wobei 1 U der Enzyrnmenge entspricht, die 1 fimol Sub- 
5 strat pro Minute umsetzt. Die Proteinkonzentrationen in den Proben wurden nach 

Lowry et ah (Lowry, O. H., N. J. Rosebrough, A. L. Farr und R. J. Randall. 1951. J. 
Biol. Chem. 193:265-275) bestimmt. 

Electrophoretische Methoden. 

10 Die Auftrennung von proteinhaltigen Extrakten erfolgte in 7.4% (wt/vol) Poly- 

acrylamidgelen unter nativen Bedingungen nach der Methode von Stegemann et al. 
(Stegemann et al. 1973. Z. Naturforsch. 28c:722-732) und unter denaturierenden 
Bedingungen in 1 1.5% (wt/vol) Polyacrylamidgelen nach der Methode von Laemmli 
(Laemmli, U. K. 1970. Nature (London) 227:680-685). Zur unspezifischen Protein- 

15 farbung wurde Serva Blue R verwendet. Zur spezifischen Anfarbung der Conife- 

rylalkohol-, Coniferylaldehyd- und Vanillin-Dehydrogenase wurden die Gele fur 20 
min in 100 mM KP-Puffer (pH 7.0) umgepuffert und anschlieBend bei 30°C im glei- 
chen Puffer dem 0.08% (wt/vol) NAD, 0.04% (wt/vol) p-Nitroblau-Tetrazolium- 
chlorid, 0.003% (wt/vol) Phenazine-Methosulfat und 1 mM des jeweiligen Substrates 

20 zugesetzt worden war inkubiert, bis entsprechende Farbbanden sichtbar wurden. 

Transfer von Proteinen aus Polyacrylamidgelen auf PVDF-Membranen. Pro- 
teine wurden aus SDS-Polyacrylamidgelen mit Hilfe eines Semidry-Fastblot Gerates 
(B32/33, Biometra, Gottingen, Deutschland) nach Herstellerangaben auf PVDF- 
25 Membranen (Waters-Milipore, Bedford, Mass., USA) ubertragen. 

Bestimmung von N-terminalcn Aminosauresequcnzcn. 

Die Bestimmung von N-terminalen Aminosauresequenzen erfolgte mit Hilfe cincs 
Protein Peptide Sequenzers (Typ 477 A, Applied Biosystems, Foster City, USA) und 
30 eincs PTH-Analysers nach Herstellerangaben. 
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Isolierung und Manipulation von DNA. 

Die Isolierung von genomischer DNA erfolgte nach der Methode von Marmur 
(Marmur, J. 1961. J. Mol. Biol. 3:208-218). Die Isolierung und Analyse von anderer 
Plasmid-DNA bzw. von DNA-Restriktionsfragmenten erfolgte nach Standardmetho- 
den (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a labora- 
tory manual. 2. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring Habor, 
New York.). 

Transfer von DNA. 

Die Preparation und Transformation von kompetenten Escherichia co//-Zellen 
erfolgte nach der Methode von Hanahan (Hanahan, D. 1983. J. Mol. Biol. 166:557- 
580). Konjugativer Plasmidtransfer zwischen Plasmid-tragenden Escherichia coli 
S17-1-Stammen (Donor) und Pseudomonas sp.-Stammen (Rezipient) erfolgte auf 
NB-Agarplatten nach der Methode von Friedrich et al. (Friedrich, B. et al. 1981. J. 
Bacteriol. 147:198-205), oder durch eine "Minikomplementations-Methode" auf 
MM-Agarplatten mit 0.5% (wt/vol) Gluconat als C-Quelle und 25 pg/ml Tetracyclin 
oder 100 pg/ml Kanamycin. Dabei wurden Zellen des Rezipienten in einer Richtung 
als Impfstrich aufgetragen. Nach 5 min wurden dann Zellen der Donor-Stamme als 
Impfstriche aufgetragen, wobei der Rezipienten-Impfstrich gekreuzt wurde. Nach 
einer Inkubation fur 48 h bei 30°C wuchsen die Transkonjuganten direkt hinter der 
Kreuzungsstelle, wohingegen weder Donor- noch Rezipienten-Stamm zum Wachs- 
tum in der Lage war. 

Hybridisierungsexperimente, 

DNA-Restriktionsfragmente wurden in einem 0.8% (wt/vol) Agarose-Gel in 50 mM 
Tris- 50 mM Borsaure- 1.25 mM EDTA-Puffer (pH 8.5) elektrophoretisch aufge- 
trennt (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a 
laboratory manual. 2. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring 
Habor, New York.). Die Ubertragung der denaturicrtcn DNA aus dcm Gel auf eine 
positiv geladene Nylonmembran (PorengroBe: 0.45 pm, Pall Filtrationstechnik, Dret- 
eich, Deutschland), die anschlieBende Hybridisicrung mit biotmylierten, bzw. 
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Digoxigenin-markierten DNA-Sonden und die Herstellung dieser DNA-Sonden 
erfolgte nach Standardmethoden (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. 
Molecular cloning: a laboratory manual. 2. AufL, Cold Spring Harbor Laboratory 
Press, Cold Spring Habor, New York.). 

5 

DNA-Scquenzierung. 

Die Bestimmung von Nukleotidsequenzen erfolgte nach der Didesoxy-Kettenab- 
bruch-Methode von Sanger et al. (Sanger et al. 1977. Proc. Natl. Acad. Sci. USA 
74:5463-5467) "nicht-radioaktiv" mit einem "LI-COR DNA-Sequencer Modell 
10 4000L" (LLCOR Inc., Biotechnology Division, Lincoln, NE,.USA) unter Verwen- 

dung eines "Thermo Sequenase fluorescent labelled primer cycle sequencing kit with 
7-deaza-dGTP" (Amersham Life Science, Amersham International pis, Little 
Chalfont, Buckinghamshire, England) jeweils nach Vorschrift des Herstellers. 

15 Mit Hilfe von synthetischen Oligonukleotiden wurde nach der "Primer-hopping 

Strategic" von Strauss et al. (Strauss, E. C. et al. 1986. Anal. Biochem. 154:353-360) 
sequenziert. 

Chemikalien, Biochemikalien und Enzyme. 

20 Restriktionsenzyme, T4 DNA-Ligase, Lambda-DNA und Enzyme bzw. Substrate fur 
die optisch enzymatischen Tests wurden von C. F. Boehringer & Sohne (Mannheim, 
Deutschland) oder von GIBCO/BRL (Eggenstein, Deutschland) bezogen. [y- 
32 P]ATP kam von Amersham/Buchler (Braunschweig, Deutschland). Oligonukleo- 
tide wurden von der Firma MWG-Biotech GmbH (Ebersberg, Deutschland) bezogen. 

25 Agarose vom Typ NA wurde von Pharmacia-LKB (Uppsala, Schweden) bezogen. 

Alle anderen Chemikalien waren von Haarmann & Reimer (Holzminden, Deutsch- 
land), E. Merck AG (Darmstadt, Deutschland), Fluka Chemie (Buchs,, Schweiz), 
Serva Fcinbiochemica (Heidelberg, Deutschland) oder Sigma Chemie (Deisenhofen, 
Deutschland). 
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Beispiele 
Beispiel 1 

5 Konstruktion von Omega-Elementen, die Resistenzen gegeniibcr Kanamycin (Q 

Km) bzw. Gentamycin( fiGm) vermitteln. 

Fur die Konstruktion des QKm-Elements wurde das 2099 bp Z?g/I-Fragment des 
Transposons Tn5 (Auerswald E. A., G. Ludwig und H. Schaller. 1981. Cold Spring 
Harb. Symp. Quant. BioL 45:107-113; Beck E., G. Ludwig, E. A. Auerswald, B. 

10 Reiss und H. Schaller. 1982, Gene 19:327-336; Mazodier P., P. Cossart, E. Giraud 
und F. Gasser. 1985. Nucleic Acids Res. 13:195-205.) praparativ isoliert. Das Frag- 
ment wurde durch Behandlung mit der Nuklease Bal-31 auf ca. 990 bp verkurzt. 
Dieses Fragment, das nur noch das Kanamycin-Resistenzgen (codierend fur eine 
Aminoglycosid-3'-0-Phosphotransferase) umfaBte, wurde anschlieBend mit Smal 

15 geschnittener pSKsym-DNA (pBluescript SK'-Derivat, welches eine symetrisch auf- 

gebaute multiple Klonierungsstelle [Sail, Hindlll, EcoRl, Smal y £coRI, Hindlll, Sail] 
enthalt) ligiert. Aus dem resultierenden Plasmid konnte das QKm-Element als Smal-^ 
£coRI-, Hindlll- oder Sa/I-Fragment reisoliert werden. 

20 Fur die Konstruktion des QGm-Elements wurde das 983 bp Eael -Fragment des 

Plasmids pBBRIMCS-5 (Kovach ME., P. H. Elzer, D. S. Hill, G. T. Robertson, M. 
A. Farris, R. M. Roop und K. M. Peterson. 1995. Gene 166:175-176.) praparativ iso- 
liert und anschlieBend mit Mung Bean Nuklease (Abdauen von einzelstrangigen 
DNA-Molekulenden) behandelt. Dieses Fragment, das nur noch das Gentamycin- 

25 Resistenzgen (codierend fur eine Gentamycin-3-Acetyltransferase) umfaBte, wurde 
anschlieBend mit Sma\ geschnittener pSKsym-DNA (s.o.) ligiert. Aus dem resultie- 
renden Plasmid konnte das QGm-Element als Smal-^ EcoRI-, Hindlll- oder Sail- 
Fragment reisoliert werden. 
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Beispiel 2 

Klonierung der Gene aus Pseudomonas sp. HR199 (DSM7063), die durch Inser- 
tion von Q-Elementen oder durch Delctionen inaktiviert werden sollten. 

5 Die separaten Klonierungen der Gene fcs, ech, vdh und aat erfolgte ausgehend von 
den E. coli SI 7-1 Stammen DSM 10439 und DSM 10440 mit den Plasmiden pE207 
und pE5-l (siehe EP-A 0845532). Aus diesen Plasmiden wurden die angegebenen 
Fragmente praparativ isoliert und wie im weiteren beschrieben behandelt; 

10 Fur die Klonierung des yes-Gens wurde das 2350 bp grofie S^/I/JJcoRI-Fragment des 

Plasmids pE207 und das 3700 bp groBe £cc>RI/iSa/I-Fragment des Plasmids pE5-l 
zusammen in pBluescript SK" in einer Weise kloniert, daB beide Fragmente uber die 
£coRI-Enden miteinander verbunden waren. Ausgehend von dem resultierenden 
Hybridplasmid wurde das 6050 bp Sa/I-Fragment praparativ isoliert und durch 

1 5 Behandlung mit der Nuklease Bal-3 1 auf ca. 2480 bp verkiirzt. AnschlieBend wurden 
an die Fragment-Enden /^/I-Linker ligiert und das Fragment nach Ps/I-Verdauung in 
pBluescript SK" kloniert (pSK/ay). Nach Transformation von E. coli XL 1 -Blue wur- 
den Klone erhalten, die das yes-Gen exprimierten und eine FCS-Aktivitat von 0.2 
U/mg Protein aufwiesen. 

20 

Fur die Klonierung des ech-Gens wurde das 3800 bp groBe //mdlll/iscoRJ-Fragment 
des Plasmids pE207 praparativ isoliert und durch Behandlung mit der Nuklease Bal- 
31 auf ca. 1470 bp verkiirzt. AnschlieBend wurden an die Fragment-Enden EcoKU 
Linker ligiert und das Fragment nach £coRI-Verdauung in pBluescript SK" kloniert 
25 (pSKech). 

Fur die Klonierung des vdh-Gens wurde das 2350 bp groBe Stf/I/£coRI-Fragment des 
Plasmids pE207 praparativ isoliert. Nach Klonierung in pBluescript SK" wurde das 
Fragment mit Hilfe eincs Exonuklease III/ Mung Bean Nukleasesystems einseitig 
30 um ca. 1530 bp verkiirzt. AnschlieBend wurde an das Fragmentcnde ein EcoRU 
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Linker ligiert und das Fragment nach JScoRI-Verdauung in pBluescript SK" kJoniert 
(pSKw/A). Nach Transformation von E. coli XL 1 -Blue wurden Klone erhalten, die 
das vdh-Gen exprimierten und eine VDH-Aktivitat von 0.01 U/mg Protein 
aufwiesen. 

5 

Fur die Klonierung des aa/-Gens wurde das 3700 bp groBe £coRJ/5'a/I-Fragment des 
Plasmids pE5-l praparativ isoliert und durch Behandlung mit der Nuklease Bal-31 
auf ca. 1590 bp verkurzt. AnschlieBend wurden an die Fragment- Enden EcoRl- 
Linker ligiert und das Fragment nach £coRLVerdauung in pBluescript SK" kloniert 
10 (pSKtftf/). 

Beispiel 3 

Inaktivierung der oben beschriebenen Gene durch Insertion von f2-Elemcnten, 
1 5 bzw durch Deletion von Teilbereichen dieser Gene. 

Das Plasmid pSK/cs, welches das yes-Gen enthielt wurde mit ZJssHII verdaut, 
wodurch ein 1290 bp groBes Fragment aus dem yes-Gen herausgeschnitten wurde. 
Nach Religation wurde das Deletions-Derivat des yes-Gens (fcsA) (siehe Abb. li und 
2i) kloniert in pBluescript SK" (pSK/csA) erhalten. Dariiber hinaus wurden nach 

20 Herausschneiden des Fragments die Omega-Elemente QKm und £X3m an dessen 
Stelle einligiert. Dadurch entstanden die D-inaktivierten Derivate des fcs-Gens (fcsCl 
Km, siehe Abb. Ig und 2g) und (/fcsQGm, siehe Abb. lh und 2h) kloniert in 
pBluescript SK" (pSKycsQKm und pSKycsQGm). In Rohextrakten der erhaltenen E. 
coli Klone, deren Hybridplasmide ein durch Deletion bzw. Q-Element-Insertion 

25 inaktiviertes yes-Gen aufwiesen, konnte keine FCS-Aktivitat nachgewiesen werden. 

Das Plasmid pSKech, welches das ech-Gcn enthielt, wurde mit Nrul verdaut, 
wodurch ein 53 bp und ein 430 bp groBes Fragment aus dem ec/r-Gen herausge- 
schnitten wurde. Nach Religation wurde das Deletions-Derivat des ec/i-Gens (echA^ 
30 siehe Abb. 11 und 21) kloniert in pBluescript SK~ (pSKechA) erhalten. Daruber 
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hinaus wurden nach Herausschneiden der Fragmente die Omega-EIemente QKm und 
QGm an deren Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des 
ech-Gens (echQKm und ecAQGm) kloniert in pBluescript SK~ (pSKechQKm und 
pSKec/?QGm). 

5 

Das Plasmid pSKvdh y welches das vdh-Gzn enthielt wurde mit i&^HII verdaut, 
wodurch ein 210 bp groBes Fragment aus dem vdh-Gzn herausgeschnitten wurde. 
Nach Religation wurde das Deletions-Derivat des vc//?-Gens (vdhA^ siehe Abb. lo 
und 2o) kloniert in pBluescript SK~ (pSKvdhA) erhalten. Dariiber hinaus wurden 

10 nach Herausschneiden des Fragments die Omega-EIemente QKm und QGm an 

dessen Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des vdh- 
Gens (ydhQKm und vdhClGm) kloniert in pBluescript SK~ (pSKv<#*QKm, siehe 
Abb. 1m und 2m) und (pSKv^/MXim, siehe Abb. In und 2n). In Rohextrakten der 
erhaltenen E. coll Klone, deren Hybridplasmide ein durch Deletion bzw. Q-Element- 

15 Insertion inaktiviertes vdh-Gen aufwiesen, konnte keine VDH-Aktivitat nachge- 

wiesen werden. 

Das Plasmid pSKaaf, welches das aar-Gen enthielt wurde mit Z&sHII verdaut, 
wodurch ein 59 bp groBes Fragment aus dem aa/-Gen herausgeschnitten wurde. 

20 Nach Religation wurde das Deletions-Derivat des aat-Gens (aaiA, siehe Abb. lr und 
2r) kloniert in pBluescript SK" (pSKaatA) erhalten. Dariiber hinaus wurden nach 
Herausschneiden des Fragments die Omega-EIemente QKm und QGm an dessen 
Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des <?a/-Gens {aat 
QKm, siehe Abb. lp und 2p) und (a^/DGrn, siehe Abb. Iq und 2q) kloniert in 

25 pBluescript SK" (pSKaafQKm und pSKaa/QGm). 
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Beispiel 4 

Umklonieren der durch Q-EIemente inaktivierten Gene in das konjugativ uber- 
tragbare "Suizid-Plasmid" pSUP202. 

Um die durch Q-Elemente inaktivierten Gene in Pseudomonas sp. HR199 gegen die 
intakten Gene austauschen zu konnen, benotigt man einen Vektor, der einerseits in 
Pseudomonaden ubertragen werden kann (konjugativ ubertragbare Plasmide), ande- 
rerseits dort jedoch nicht repliziert werden kann und somit in Pseudomonaden insta- 
bil ist ("Suizid-Plasmid"). DNA-Abschnitte, die mit Hilfe eines solchen Plasmid- 
systems in Pseudomonaden ubertragen werden, konnen nur erhalten bleiben, wenn 
sie durch homologe Rekombination (RecA-abhangige Rekombination) in das Genom 
der Bakterienzelle integriert werden. Im vorliegenden Fall wurde das "Suizid- 
Plasmid" pSUP202 (Simon et aL 1983. In: A. Puhler. Molecular genetics of the 
bacteria-plant interaction. Springer Verlag, Berlin, Heidelberg, New York, S. 98- 
1 06.) eingesetzt. 

Die inaktivierten Gene fcsQKm und fcsCIGm wurden nach /\s7l-Verdauung aus den 
Plasmiden pSK/csQKm und pSK/csQGm isoliert und mit Pstl geschnittener 
pSUP202 DNA ligiert Die Ligationsansatze wurden nach E, coli SI 7-1 transfor- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
Hybridplasmid (pSUP/c^QKm) das inaktivierte Gen fcsQKm enthielt. Das entspre- 
chende Hybridplasmid (pSUP/csQGm) der Gentamycin- resistenten Transformanden 
enthielt das inaktivierte Gen fcsQGm. 

Die inaktivierten Gene ec/iQKm und echQGm wurden nach £coRI-Verdauung aus 
den Plasmiden pSKec/zQKm und pSKec/iQGm isoliert und mit EcoRl geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach £ coli SI 7-1 transfer- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, dcren 
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Hybridplasmid (pSJJPechQKm) das inaktivierte Gen echQKm enthielt. Das entspre- 
chende Hybridplasmid (pSUPec/zQGm) der Gentamycin- resistenten Transforman- 
den enthielt das inaktivierte Gen echOGm. 

Die inaktivierten Gene vdhQKm und vdhQGm wurden nach £cc?RI-Verdauung aus 
den Plasmiden pSKvdhQKm und pSKvdhQGm isoliert und mit EcoRl geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli SI 7-1 transfor- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanarnycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
Hybridplasmid (pSUPvJ/?nKm) das inaktivierte Gen vdhQKxn^ enthielt Das entspre- 
chende Hybridplasmid (pSUPvJ/?QGm) der Gentamycin- resistenten Transforman- 
den enthielt das inaktivierte Gen vrf/iQGm. 



Die inaktivierten Gene aatQKm und aa/QGm wurden nach £coRI-Verdauung aus 
den Plasmiden pSKaa/flKm und pSKaatQGm isoliert und mit EcoRI geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli SI 7-1 transfor- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanarnycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
Hybridplasmid (pSUPaa/QKm) das inaktivierte Gen aatQKm enthielt. Das entspre- 
chende Hybridplasmid (pSUPaa/QGm) der Gentamycin- resistenten Transformanden 
enthielt das inaktivierte Gen aatCiGm. 



Beispiel 5 



Umklonieren der durch Deletion inaktivierten Gene in das konjugativ uber- 
tragbarc "Suizid-Plasmid" mit "sactf-Selektionssystem" pHE55. 
Um die durch Deletion inaktivierten Gene in Pseudomonas sp. HR199 gegen die 
intakten Gene austauschen zu konnen, benotigt man einen Vektor, der die schon fiir 
pSUP202 beschriebenen Eigenschaften aufweist. Da im Gegensatz zu den durch Q- 
Element inaktivierten Genen bei durch Deletion inaktivierten Genen keine Selek- 
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tionsmoglichkeit (keine Antibiotika-Resistenz) fur den erfolgten Austausch der Gene 
in Pseudomonas sp. HR199 besteht, muBte ein anderes Selektionssystem zur 
Anwendung kommen. Bei dem "sarctf-Selektionssystem" wird das auszutauschende, 
durch Deletion inaktivierte Gen in einem Plasmid kloniert, welches neben einem 
Antibiotika-Resistenzgen auch uber das sacB-Gen verfugt. Nach konjugativer Ober- 
tragung dieses Hybridplasmids in einen Pseudomonaden wird das Plasmid durch 
homologe Rekombination an der Stelle in das Genom integriert, an der sich das 
intakte Gen befindet (erster "Cross over"). Auf diese Weise entsteht ein "heteroge- 
noter" Stamm, der sowohl uber ein intaktes als auch uber ein durch Deletion inakti- 
viertes Gen verfugt, welche durch die pHE55-DNA voneinander getrennt sind. Diese 
Stamme weisen die durch den Vektor codierte Resistenz auf und besitzen daruber 
hinaus ein aktives sacB-Gen. Durch ein zweites homologes Rekombinationsereignis 
(zweiter "Cross over"), soil nun die pHE55-DNA zusammen mit dem intakten Gen 
aus der genomischen DNA ausgegliedert werden. Durch dieses Rekombinations- 
ereignis entsteht ein Stamm, der nur noch uber das inaktivierte Gen verfugt. Daruber 
hinaus kommt es zum Verlust der pHE55-codierten Antibiotika-Resistenz und des 
sacB-Gens. Streicht man Stamme auf Saccharose-haltigen Medien aus, werden 
Stamme die das sacB-Gcn exprimieren im Wachstum gehemmt, da das Genprodukt 
Saccharose zu einem Polymer umsetzt, welches im Periplasma der Zellen 
akkumuliert wird. Zellen, die durch das zweite Rekombinationsereignis das sacB- 
Gen nicht mehr tragen, werden somit nicht im Wachstum gehemmt. Um eine 
phanotypische Selektionsmoglichkeit auf die Integration des durch Deletion inakti- 
vierten Gens zu besitzen, tauscht man dieses nicht gegen ein intaktes Gen aus, 
sondern man bedient sich eines Stammes, in dem das auszutauschende Gen bereits 
durch Insertion eines Q-Elements "markiert" vorliegt. Bei erfolgreichem Austausch 
verliert der rcsultierendc Stamm die durch das Q-Elemcnt codierte Antibiotika- 
Resistenz. 

Das inaktivierte Gen fcsA wurden nach /^/l-Verdauung aus dem Plasmid pSK/csA 
isoliert und mit Pst\ geschnittencr pHE55 DNA ligiert. Der Ligationsansatz wurde 
nach E coli SI 7-1 transformiert. Die Sclektion erfolgtc auf Tetracyclffi-haltigem LB- 
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Medium. Es wurden Tetracyclin-resistente Transformanden erhalten, deren Hybrid- 
plasmid (pHE/csA) das inaktivierte Gen fcsA enthielt. 

Das inaktivierte Gen echA wurden nach £coRI-Verdauung aus dern Plasmid 
5 pSKechA isoliert und mit Mung Bean Nuklease behandelt (Erzeugung von glatten 

Enden ["blunt ends"]). Das Fragment wurde mit BamHl geschnittener und Mung 
Bean Nuklease behandelter pHE55 DNA ligiert. Der Ligationsansatz wurde nach E, 
coli S 1 7- 1 transformiert. Die Selektion erfolgte auf Tetracyclin-haltigem LB- 
Medium. Es wurden Tetracyclin-resistente Transformanden erhalten, deren 
10 Hybridplasmid (pHEechA) das inaktivierte Gen echA enthielt. 

Das inaktivierte Gen vdhA wurden nach £c<?RI-Verdauung aus dem Plasmid 
pSY^vdhA isoliert und mit Mung Bean Nuklease behandelt. Das Fragment wurde mit 
BamHl geschnittener und Mung Bean Nuklease behandelter pHE55 DNA ligiert. Der 
15 Ligationsansatz wurde nach E. coli SI 7-1 transformiert. Die Selektion erfolgte auf 

Tetracyclin-haltigem LB-Medium. Es wurden Tetracyclin-resistente Transformanden 
erhalten > deren Hybridplasmid (pHEvdhA) das inaktivierte Gen vdhA enthielt. 

Das inaktivierte Gen aatA wurden nach ZscoRI-Verdauung aus dem Plasmid 
20 pSK<7<3/A isoliert und mit Mung Bean Nuklease behandelt Das Fragment wurde mit 
BamHl geschnittener und Mung Bean Nuklease behandelter pHE55 DNA ligiert. Der 
Ligationsansatz wurde nach E. coli SI 7-1 transformiert. Die Selektion erfolgte auf 
Tetracyclin-haltigem LB-Medium. Es wurden Tetracyclin-resistente Transformanden 
erhalten, deren Hybridplasmid (pHEaarA)das inaktivierte Gen aatA enthielt. 

25 
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Beispicl 6 

Erzeugung von Mutanten des Stammes Pseudomonas sp. HR199, bei denen 
spezifisch Gene des Eugenol-Katabolismuses durch Insertion eines Q-Elementes 
inaktiviert wurden. 

Der Stamm Pseudomonas sp. HR199 wurde als Rezipient in Konjugationsexperi- 
menten eingesetzt, bei denen Stamme von E. coli SI 7-1 als Donoren eingesetzt 
wurden, die die unten aufgefiihrten Hybridplasmide von pSUP202 enthielten. Die 
Transkonjuganten wurden auf Gluconat-haltigem Mineralmedium selektiert, welches 
das dem Q-EIement entsprechende Antibiotikum enthielt. "Homogenote" (Austausch 
des intakten Gens gegen das durch Q-Element-Insertion inaktivierte Gen durch 
doppeltes "Cross over") und n heterogenote n (Integration des Hybridplasmids in das 
Genom durch einfachen "Cross over") Transkonjuganten konnten anhand der durch 
pSUP202 codierten Tetracyclin-Resistenz unterschieden werden. 

Die Mutanten Pseudomonas sp. HR199 fcsQKm und Pseudomonas sp. HR199/csQ 
Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 
(pSUP/e^QKm) bzw. E. coli SI 7-1 (pSUP/csQGm) erhalten. Der Austausch des 
intakten /cy-Gens gegen das durch QKm bzw. QGm inaktivierte Gen (fcsQKm bzw. 
fcsQGm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanten Pseudomonas sp. HR199 echQKm und Pseudomonas sp. HR199 echCl 
Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E coli SI 7-1 
(pSUPecfcQKm) bzw. E. coli SI 7-1 (pSUPec/zQGm) erhalten. Der Austausch des 
intakten ec/?-Gens gegen das durch QKm bzw. QGm inaktivierte Gen {echQKm 
bzw. echOGm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanlen Pseudomonas sp. HR199 vdhQKm und Pseudomonas sp. HR199 vdh 
QGm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 
(pSUPv<//iQKm) bzw. E. coli SI 7-1 (pSUPvJZ/QGm) erhalten. Der Austausch des 
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intakten vdh-Gens gegen das durch QKm bzw. QGm inaktivierte Gen (vdhQKm 
bzw. vdhQGm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanten Pseudomonas sp. HR199 aatQKm und Pseudomonas sp. HR199 aatQ 
5 Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 

(pSUPatf/QKm) bzw. £ co// SI 7-1 (pSUPaatQGm) erhalten. Der Austausch des 
intakten aat-Gzns gegen das durch QKm bzw. QGm inaktivierte Gen (aatQKm bzw. 
aatQGm) wurde mittels DNA-Sequenzierung verifiziert. 

0 Die Mutante Pseudomonas sp. HR1 99 fcsQKmvdhQGm wurden nach Konjugation 

von Pseudomonas sp. HR199 fcsQKm mit E. coli SI 7-1 (pSUPvJ/?QGm) erhalten. 
Der Austausch des intakten vdh-Gens gegen das durch QGm inaktivierte Gen (vdhQ 
Gm) wurde mittels DNA-Sequenzierung verifiziert. 



Die Mutante Pseudomonas sp. HR199 vdhQKmaatQGm wurden nach Konjugation 
von Pseudomonas sp. HR199 vdhQKm mit E. coli S17-1 (pSUPaa/QGm) erhalten. 
Der Austausch des intakten a<7/-Gens gegen das durch QGm inaktivierte Gen (aatQ 
Gm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutante Pseudomonas sp. HR199 vdhQKmechQGm wurden nach Konjugation 
von Pseudomonas sp. HR199 v<#zQKm mit E. coli SI 7-1 (pSUPec/zQGm) erhalten. 
Der Austausch des intakten ec/?-Gens gegen das durch QGm inaktivierte Gen (echQ 
Gm) wurde mittels DNA-Sequenzierung verifiziert. 
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Beispiel 7 

Erzeugung von Mutanten des Stammes Pseudomonas sp, HR199, bci denen 
spezifisch Gene des Eugenol-Katabolismuses durch Deletion eines Teilbereiches 
5 inaktiviert wurden. 

Die Stamme Pseudomonas sp. HR199 fcsQKm, Pseudomonas sp. HR199 echOKm, 
Pseudomonas sp. HR199 vdhQKm und Pseudomonas sp. HR199 aatQKm wurden 
als Rezipient in Konjugationsexperimenten eingesetzt, bei denen Stamme von E. coli 
SI 7-1 als Donoren eingesetzt wurden, die die unten aufgefuhrteri H^bg^asmide 

10 von pHE55 enthielten. Die "heterogenoten" Transkonjuganfen wurden auf Gluconat- 
haltigem Mineralmedium selektiert, welches neben Tetracyclin (pHE55 codierte 
Resistenz) das dem Q-Element entsprechende Antibiotikum enthielt. Nach Ausstrei- 
chen auf Saccharose-haltigem Mineralmedium wurden Transkonjuganten erhalten, 
die durch ein zweites Rekombinationsereignis (zweiter "Cross over") die Vektor- 

15 DNA eliminiert hatten. Durch Ausstreichen auf Mineralmedium ohne Antibiotika 

bzw. mit dem Q-Element entsprechenden Antibiotikum konnten die Mutanten 
erkannt werden, bei denen das durch Q-Element inaktivierte Gen gegen das durch 
Deletion inaktivierte Gen ausgetauscht worden war (keine Antibiotika-Resistenz), 

20 Die Mutante Pseudomonas sp. HR199 fcsA wurde nach Konjugation von Pseudomo- 
nas sp. HR199 fcsQKm mit E. coli SI 7-1 (pHE/cyA) erhalten. Der Austausch des 
durch QKjti inaktivierten Gens (fcsQKsti) gegen das durch Deletion inaktivierte Gen 
(fcsA) wurde mittels DNA-Sequenzierung verifiziert. 

25 Die Mutanten Pseudomonas sp. HR199 echA wurde nach Konjugation von Pseudo- 

monas sp. HR199 echClKm mit E. coli SI 7-1 (pHEechA) erhalten. Der Austausch 
des durch QKm inaktivierten Gens (echClKm) gegen das durch Deletion inaktivierte 
Gen (echA) wurde mittels DNA-Scquenzierung verifiziert. 
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Die Mutanten Pseudomonas sp. HR199 vdhA wurde nach Konjugation von Pseu- 
domonas sp. HR199 vdhQKm mit E, coli SI 7-1 (pHEvdhA) erhalten. Der Austausch 
des durch QKm inaktivierten Gens {vdhQKm) gegen das durch Deletion inaktivierte 
Gen (vdhA) wurde mittels DNA-Sequenzierung verifiziert. 

5 

Die Mutanten Pseudomonas sp. HR199 aatA wurde nach Konjugation von Pseudo- 
monas sp. HR1 99 aatQKm mit E. coli SI 7-1 (pHEaa/A) erhalten. Der Austausch des 
durch QKm inaktivierten Gens (aatQKm) gegen das durch Deletion inaktivierte Gen 
(aalA) wurde mittels DNA-Sequenzierung verifiziert. 

10 

Beispiel 8 

Biotransformation von Eugenol zu Vanillin mit der Mutante Pseudomonas sp. 
HR199 vrf/ifiKm. 

15 Der Stamm Pseudomonas sp. HR199 vdhQKm wurde in 50 ml HR-MM mit 6 mM 

Eugenol bis zu einer optischen Dichte von ca. OD600nm = 0.6 angezogen. Nach 1 7 h 
waren 2.9 mM Vanillin, 1.4 mM Ferulasaure und 0.4 mM Vanillinsaure im Kultur- 
uberstand nachweisbar. 

20 Beispiel 9 

Biotransformation von Eugenol zu Ferulasaure mit der Mutante Pseudomonas 
sp. HR199 vrf/iQGmfla/QKm. 

Der Stamm Pseudomonas sp. HR199 vdhQGmaatQKm wurde in 50 ml HR-MM mit 
25 6 mM Eugenol bis zu einer optischen Dichte von ca. OD600nm = 0.6 angezogen. 

Nach 18 h waren 1.9 mM Vanillin. 2.4 mM Ferulasaure und 0.6 mM Vanillinsaure 
im Kulluruberstand nachweisbar. 
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Beispiel 10 

^ Biotransformation von Eugenol zu Conifcrylalkohol mit der Mutante Pseudo- 
monas sp. HR199 vdhQGmaatQKm. 
5 Der Stamm Pseudomonas sp. HR199 vdhQGmaalQKm wurde in 50 ml HR-MM mit 
6 mM Eugenol bis zu einer optischen Dichte von ca. OD600nm = 0.4 angezogen. 
Nach 15 h waren 1.7 mM Coniferylalkohol, 1.4 mM Vanillin, 1.4 mM Ferulasaure 
und 0.2 mM Vanillinsaure im Kulturiiberstand nachweisbar. 

10 Beispiel 11 

Fermentative Produktion von natiiriiehem Vanillin aus Eugenol im 10 1 

Fermenter mit der Mutante Pseudomonas sp. HR 199 vdhQKm. 

Mit 100 ml einer 24 Stunden alten Vorkultur, die auf einer Schuttelmaschine (120 

15 Upm) bei 32°C in einem auf pH 7,0 eingestellten Medium aus 12,5 g/1 Glyzerin, 

10 g/1 Hefeextrakt und 0,37 g/1 Essigsaure angezogen wurde, wurde der Produktions- 
fermenter beimpft. Der Fermenter enthielt 9,9 1 Medium mit folgender Zusammen- 
setzung: 1,5 g/1 Hefeextrakt, 1,6 g/1 KH 2 P0 4 , 0,2 g/1 NaCl, 0,2 g/1 MgS0 4 . Der pH- 
Wert wurde mit Natronlauge auf pH 7,0 eingestellt. Nach der Sterilisation wurde 

20 dem Medium 4 g Eugenol zugefugt. Die Temperatur betrug 32°C, die Beliiftung 3 
Nl/min und die Ruhrerdrehzahl 600 Upm. Der pH-Wert wurde mit Natronlauge bei 
pH 6,5 gehalten. 

Vier Stunden nach dem Animpfen wurde mit der kontinuierlichen Zugabe von 
25 Eugenol begonnen, so dafi am Ende der Fermentation nach 65 Stunden 255 g Euge- 
nol zur Kultur gegeben worden waren. AuBerdem wurden wahrend der Fermentation 
40 g Hefeextrakt zugefuttert. Die Konzentration an Eugenol lag am Ende der Fer- 
mentation bei 0,2 g/1. Der Gehalt an Vanillin betrug 2,6 g/1. Zusatzlich lagen noch 
3,4 g/1 Ferulasaure vor. 
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Das so erhaltene Vanillin kann durch bekannte physikalische Verfahren wie Chro- 
matographic, Destination und/oder Extraktion isoliert und zur Herstellung naturlicher 
Aromen verwendet werden. 

5 Erlauterungen zu den Figuren: 

FIG. la bis lr: 

Gen- Strukturen zur Gewinnung von Organismen und Mutanten 

10 

calA*: Teil des inaktivierten Gens der Coniferylalkohol-Dehydrogenase 
calB*\ Teil des inaktivierten Gens der Coniferylaldehyd-Dehydrogenase 
fcs*: Teil des inaktivierten Gens der Ferulasaure-CoA Synthetase 
ech*: Teil des inaktivierten Gens der Enoyl-CoA Hydratase-Aldolase 
1 5 vdh*: Teil des inaktivierten Gens der Vanillin-Dehydrogenase 
aa/* : Teil des inaktivierten Gens der beta-Ketothiolase 

Die mit versehenen Restriktionsenzym-Schnittstellen kamen fur die Konstruktion 
zum Einsatz, sind jedoch in dem resultierenden Konstrukt nicht mehr funktionsfahig. 

20 
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10 



15 



FIG. 2a: Nukleotidsequenz der Gen-Struktur calAQKm 
FIG. 2b: Nukleotidsequenz der Gen-Struktur calACIGm: 
FIG. 2c: Nukleotidsequenz der Gen-Struktur calAA 
FIG. 2d: Nukleotidsequenz der Gen-Struktur calBQKm 
FIG. 2e: Nukleotidsequenz der Gen-Struktur calBCIGm 
FIG. 2f: Nukleotidsequenz der Gen-Struktur calBA 
FIG. 2g: Nukleotidsequenz der Gen-Struktur fcsQKm 
FIG. 2h: Nukleotidsequenz der Gen-Struktur fcsQGm 
FIG. 2i: Nukleotidsequenz der Gen-Struktur fcsA 
FIG. 2j: Nukleotidsequenz der Gen-Struktur echQKm 
FIG. 2k: Nukleotidsequenz der Gen-Struktur echClGm 
FIG. 21: Nukleotidsequenz der Gen-Struktur echA 
FIG. 2m: Nukleotidsequenz der Gen-Struktur vdhQKm 
FIG. 2n: Nukleotidsequenz der Gen-Struktur vdhOGm 
FIG. 2o: Nukleotidsequenz der Gen-Struktur vdhA 
FIG. 2p: Nukleotidsequenz der Gen-Struktur aaiQKxw 
FIG. 2q: Nukleotidsequenz der Gen-Struktur aalQGm 
FIG. 2r: Nukleotidsequenz der Gen-Struktur aatA 
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Paten tanspriichc 

1 . Transformierter und/oder mutagenisierter ein- oder mehrzelliger Organismus, 
der dadurch gekennzeichnet ist, daB Enzyme des Eugenol- und/oder Ferula- 

5 saure-Katabolismus derail inaktiviert sind, daB eine Akkumulation der 

Intermediate Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin 
und/oder Vanillinsaure ^rfolgt. 

2. Organismus nach Anspruch 1, dadurch gekennzeichnet, daB der Eugenol- 
10 und/oder Ferulasaure-Katabolismus durch Q-EIement~-Insertion oder Einfiih- 

ren von Deletionen in entsprechende Gene verandert ist. 

3. Organismus nach einem der Anspriiche 1 oder 2, dadurch gekennzeichnet, 
daB ein oder mehrere Gene, die fur die Enzyme Coniferylalkohol-Dehydro- 

15 genasen, Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA Synthetasen, 

Enoyl-CoA Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydro- 
genasen oder Vanillinsaure-Demethylasen Enzyme kodieren, verandert 
und/oder inaktiviert sind. 

20 4. Organismus nach einem der Anspriiche 1 bis 3, dadurch gekennzeichnet, daB 
er einzellig, vorzugsweise ein Mikroorganismus oder eine pflanzliche oder 
eine tierische Zelle ist. 

5. Organismus nach einem der Anspriiche 1 bis 4, dadurch gekennzeichnet, daB 
25 er ein Bakterium, vorzugsweise eine Pseudomonas-Art ist. 

6. Gcn-Strukturen, bei denen die fur die Enzyme Coniferylalkohol-Dehydroge- 
nasen, Conifcrylaldehyd-Dehydrogenasen, Ferulasaure-CoA Synthetasen, 
Enoyl-CoA I lydratasen-Aldolasen, beta-Ketolhiolasen, Vanillin-Dchydroge- 

30 nascn oderVanillinsaurc-Demethylascn oder zweier oder mehrcrer dieser En- 

zyme kodierenden Nukleotidscquenzen verandert und/oder inaktiviert sind. 
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Gen-Strukturen mit den in Figur la bis Ir angegebenen Strukturen. 

Gen-Strukturen mit den in Figur 2a bis 2r angegebenen Sequenzen. 

Vektoren enthaltend wenigstens eine Gen-Struktur nach einem der Anspruche 
6 bis 8. 

Transformierter Organismus nach einem der Anspruche 1 bis 5, dadurch 
gekennzeichnet, daB er wenigstens einen Vektor gemaB Anspruch 9 enthalt. 

Organismus nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, daB 
er wenigstens eine Gen-Struktur nach einem der Anspruche 6 bis 8 an Stelle 
des jeweiligen intakten Gens im Genom integriert enthalt. 

Verfahren zur biotechnischen Herstellung von organischen Verbindungen, 
insbesondere von Alkoholen, Aldehyden und organischen Sauren, dadurch 
gekennzeichnet, daB ein Organismus nach einem der Anspruche I bis 5 oder 
10 bis 11 eingesetzt wird. 

Verfahren zur Herstellung der Organismen nach einem der Anspruche 1 bis 5, 
dadurch gekennzeichnet, daB die Veranderung des Eugenol- und/oder Ferula- 
saure-Katabolismus mittels an sich bekannter mikrobiologischer Zuchtungs- 
methoden erzielt wird. 

Verfahren zur Herstellung eines Organismus nach einem der Anspruche 1 bis 
5 oder 10 bis 11, dadurch gekennzeichnet, daB die Veranderung des Eugenol- 
und/oder Ferulasaure-Katabolismus und/oder die Inaktivierung der entspre- 
chenden Gene mittels gentechnischcr Mcthoden erziell wird. 
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15. Verwendung der Organismen nach einem der Anspruche 1 bis 5 oder 10 bis 
1 1 zur Herstellung von Coniferylalkohol, Coniferylaldehyd, Ferulasaure, 
Vanillin und/oder Vanillinsaure. 

16. Verwendung von Gen-Strukturen nach einem der Anspruche 6 bis 8 oder 
eines Vektors nach Anspruch 9 zur Herstellung transformierter und/oder 
mutagenisierter Organismen. 
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calAQKm 
Fig. 1a 

calACIGm 
Fig. 1b 

calAA 




Deletion von 539 bp 



Fig. 1c 



calBClKm 
Fig. 1d 

calBQ-Gm 
Fig. 1e 

calBA 




Deletion von 586 bp 



Fig. 1f 
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Fig. ig 



Psft 



BssHirSmal* 



Smal* BssHir 



Psfl 



fcsQGm 



l&Gm-Elementl 



Fig. 1h 



essHii 



Fig. 1i 



Deletion von 1 290 bp 



Pst\ 




EcoRl 



Nru\* Smal* 



echQKm 




EcoRl 



Fig. 1j 



echQGm 
Fig. 1k 

echA 




Deletion von 483 bp 



Fig. 11 
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vdhOKm 
Fig. 1m 

vdhQGm 
'•Fig. 1 n 

vdhA 




Deletion von 210 bp 



Fig. 1o 



aafQKm 
Fig. 1p 

aa/QGm 
Fig. 1q 

aatA 




Deletion von 59 bp 



Fig. 1r 
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Sequenzen 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TG AT TAG AG A CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC 472 
Met Gin Leu Thr Asn Lys Lys lie Val Val Thr Gly Val Ser Ser 
1 5 10-15 

GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
Gly lie Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr 
20 25 30 

GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568 
Val He Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 

GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GAT AAG GCC ATC GGG 616 
Val Gin Ala Asp Leu Ser His Pro Glu Gly He Asp Lys Ala He 
50 55 60 62 

ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC 676 

AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT 7 36 

GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC 7 90 

Met He Glu Gin Asp Gly Leu His 
1 5 

GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG 838 
Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp 
10 15 20 

GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA 886 
Ala Gin Gin Thr He Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser 
25 30 35 40 

GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC 934 
Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala 
45 50 55 

CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG 982 
Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr 
60 65 70 
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ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA 1030 
Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly 
75 80 85 

AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA 1078 
Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser 
90 95 100 

TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG 1126 
Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met Ala Asp Ala Met 
105 110 115 120 

CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA 117 4 

Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin 
125 130 135 

GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT 1222 
Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu 
140 145 150 

GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC 1270 
Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala 
155 160 165 

GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC 1318 
Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu 
170 175 180 

GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT 1366 
Val Val Thr His Gly Asp Ala Cys Leu Pro Asn lie Met Val Glu Asn 
185 190 195 200 

GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC 1414 
Gly Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu Gly Val Ala Asp 
205 210 215 

CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT 14 62 

Arg Tyr Gin Asp lie Ala Leu Ala Thr Arg Asp He Ala Glu Glu Leu 
220 225 230 

GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT 1510 
Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala Ala 
235 240 245 

CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC 1558 
Pro Asp Ser Gin Arg He Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 
250 255 260 264 

TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCTG GCC GCG GTG 1613 

Ala Ala Val 
225 

ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT 1661 
lie Ala Phe Mot Cys Ala Glu Glu Ser Arg Trp Tie Asn Gly lie Asn 
230 235 240 
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ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 1710 
lie Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val 
245 250 255 

GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 1770 

GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 1830 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 18 90 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 1950 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 2010 

CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 2070 

ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 2130 

TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 2164 

FIG . 2a: 
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CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CAT T AAC TAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC 4 72 
Met Gin Leu Thr Asn Lys Lys lie Val Val Thr Gly Val Ser Ser 
15 10 15 

GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
Gly He Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr 
20 25 30 



GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568 
Val He Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 



GTT CAG GCT GAC CTG AGC CAT CCT GAGGGGAGAG GCGGTTTGCG TATTGGGCGC 622 
Val Gin Ala Asp Leu Ser His Pro 
50 55 

ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG 682 

GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG 7 42 

CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT 802 

CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA 8 62 

CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT 922 

TTGTACAGTC TATGCCTCGG GC AT CCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT 982 

TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG 1033 

Met Leu Arg Ser Ser Asn Asp Val Thr Gin 
15 10 



CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC 1081 
Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly Ser Ser Met Gly He 
15 20 25 



ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT 1129 
He Arg Thr Cys Arg Leu Gly Pro Asp Gin Val Lys Ser Met Arg Ala 
30 35 40 



GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC 
A] a Leu Asp Leu Phe GJ y Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser 
45 50 55 
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CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG 1225 
Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys 
60 65 70 

ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT 127 3 

Thr Phe lie Ala Leu Ala Ala Phe Asp Gin Glu Ala Val Val Gly Ala 
75 80 85 90 

CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC 1321 
Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin Pro Arg Ser Glu He 
95 100 105 

TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT 1369 
Tyr He Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gin Gly He 
110 115 120 

GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT 1417 
Ala Thr Ala Leu He Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly 
125 130 135 

GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG 14 65 

Ala Tyr Val He Tyr Val Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val 
140 145 150 

GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT 1513 
Ala Leu Tyr Thr Lys Leu Gly He Arg Glu Glu Val Met His Phe Asp 
155 160 165 170 

ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCT 1567 
He Asp Pro Ser Thr Ala Thr 
175 177 

G ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT 1616 
He Ala Phe Met Cys Ala Glu Glu Ser Arg Trp lie Asn Gly He Asn 
228 230 235 240 

ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 1665 
He Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val 
245 250 255 

GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 1725 

GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 1785 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 184 5 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 1905 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 1965 

CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 202 5 

ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 2085 

TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 2119 



FIG. 2b: 
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CTGCAGCCAG GGCTGAAAAG GAGGG ATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT .300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA T GAT TAG AG A CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC 472 
Met Gin Leu Thr Asn Lys Lys lie Val Val Thr Gly Val Ser Ser 
15 10 15 

GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
Gly lie Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr 
20 25 30 

GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 5 68 
Val lie Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 

GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GATC AAC GGC ATA AAT 617 
Val Gin Ala Asp Leu Ser His Pro Glu Gly lie Asn Gly lie Asn 
50 55 58 240 

ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 666 
lie Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val 
245 250 255 

GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 72 6 

GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 78 6 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 84 6 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 906 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 966 

CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 1026 

ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 1086 

TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 1120 

FIG. 2c: 
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GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC .300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CG ATG AGC ATT CTT GGT TTG AAT 4 73 

Met Ser He Leu Gly Leu Asn 
1 5 

GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG 521 

Gly Ala Pro Val Gly Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 
10 15 20 

AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG 569 
Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 

AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA 617 
Ser Arg Leu Asp Arg Ala He Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 

ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA 665 
He Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 
60 65 70 

ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 
Thr Leu Leu Cys Asp He Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 

CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 761 
Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 

TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 809 
Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
105 110 115 

GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 8 57 

Gly Val He Ser Pro Trp Asn Phe Pro Tie Val Leu Ala Phe Gly Pro 
120 125 130 135 

CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC 905 
Leu Ala Gly He Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 
140 145 150 

GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT 953 
Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu He Ala Arg 
155 160 165 ^ 
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TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 1001 
Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 

GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 104 9 

Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu lie Phe Thr Gly 
185 190 195 

GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 
Gly Thr Ala Val Ala Lys His lie Met Arg Ala Ala Ala Asp Asn Leu 
200 205 210 215 

GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 114 5 

Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val lie Val Ser 
220 225 230 

CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 
Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 
235 240 245 

ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG CTG 1241 
Thr Phe Asn Ala Gly Gin lie Cys Leu Ala Pro Asp Tyr Val Leu Leu 
250 255 26G 

CCG GAA GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT 1297 
Pro Glu 
265 

TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 1357 

GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA 1412 

Met lie Glu Gin 
1 

GAT GGA TTG CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC 14 60 

Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe 
5 10 15 20 

GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG 1508 
Gly Tyr Asp Trp Ala Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val 
25 30 35 

TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC 1556 
Phe Arg Leu Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp 
40 45 50 

CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG 1604 
Leu Ser Gly Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser 
55 60 65 

TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC 3 652 

Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val 
70 75 80 
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ACT GAA GCG GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG 1700 
Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin 
8S 90 95 100 

GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG 174 8 

Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met 
105 110 115 

GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA 17 96 

Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro 
120 125 130 

TTC GAC CAC CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG 184 4 

Phe Asp His Gin Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met 
135 140 145 

GAA GCC GGT CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG 1892 
Glu Ala Gly Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly 
150 155 160 

CTC GCG CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC 194 0 

Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 
165 170 175 180 

GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC 1988 
Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn He 
185 190 195 

ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG 2036 
Met Val Glu Asn Gly Arg Phe Ser Gly Phe He Asp Cys Gly Arg Leu 
200 205 210 

GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT 2084 
Gly Val Ala Asp Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He 
215 220 225 

GCT GAA GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC 2132 
Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr 
230 235 240 

GGT ATC GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT 2180 
Gly He Ala Ala Pro Asp Ser Gin Arg He Ala Phe Tyr Arg Leu Leu 
245 250 255 260 

GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 2235 
Asp Glu Phe Phe 
264 

CGC CAT GCC AAG CCT GTT CTC GTG CAA AGT CCT GTG GGT GAG TCG AAC 2283 

His Ala Lys Pro Val Leu Val Gin Ser Pro Val Gly Glu Ser Asn 
444 445 450 455 

TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 2331 
Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala lie His Gly Leu Leu Ser 
460 465 470 
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GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 2385 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 24 4 5 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 2505 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 2565 

CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 2 625 

CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 2 685 

ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 27 4 5 

TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 2805 
CCAACCTTGA GGAATTC 2822 
FIG. 2d: 
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GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CG ATG AGC ATT CTT GGT TTG AAT 47 3 

Met Ser lie Leu Gly Leu Asn 
1 5 

GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG 521 
Gly Ala Pro Val Gly Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 
10 15 20 

AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG 569 
Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 

AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA 617 
Ser Arg Leu Asp Arg Ala He Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 

ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA 665 
He Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 
60 65 70 

ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 
Thr Leu Leu Cys Asp He Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 

CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 761 
Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 

TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 809 
Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
105 110 115 

GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 857 
Gly Val He Ser Pro Trp Asn Phe Pro He Val Leu Ala Phe Gly Pro 
120 125 130 135 

CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC 905 
Leu Ala Gly He Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 
140 145 150 



GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT 
Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu He Ala Arg 
155 160 165 
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TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 1001 
Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 

GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 104 9 

Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu lie Phe Thr Gly 
185 190 195 

GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 
Gly Thr Ala Val Ala Lys His lie Met Arg Ala Ala Ala Asp Asn Leu 
200 205 210 215 

GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 114 5 

Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val lie Val Ser 
220 225 230 

CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 
Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 
235 240 245 

ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG GGG 1241 
Thr Phe Asn Ala Gly Gin He Cys Leu Ala Pro Asp Tyr Val Leu 
250 255 260 262 

GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT 1301 

GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC 1361 

CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA 14 21 

CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC 1481 

TCACGCAACT GG TCC AG AAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT 1541 

TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA 1601 

GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC 1656 

Met Leu Arg 
1 

AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA 1704 
Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu 
5 10 15 

GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC 17 52 

Gly Gly Ser Ser Met Gly He He Arg Thr Cys Arg Leu Gly Pro Asp 
20 25 30 35 

CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC 1800 
Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe 
40 45 50 

GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC 184 8 

Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu 
55 60 65 

GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC XX C GAC 1896 
Gly Asn Leu Leu Arg Ser Lys Thr Phe Tie Ala Leu Ala Ala Phe Asp 
70 75 80 
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CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT 194 4 

Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe 
85 90 95 

GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC 1992 
Glu Gin Pro Arg Ser Glu lie Tyr lie Tyr Asp Leu Ala Val Ser Gly 
100 105 110 115 

GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG 204 0 

Glu His Arg Arg Gin Gly lie Ala Thr Ala Leu lie Asn Leu Leu Lys 
120 125 130 

CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT 2088 
His Glu Ala Asn Ala Leu Gly Ala Tyr Val He Tyr Val Gin Ala Asp 
135 140 145 

TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG 2136 
Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly He Arg 
150 155 160 

GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA 2184 
Glu Glu Val Met His Phe Asp He Asp Pro Ser Thr Ala Thr 
165 170 175 177 

TTCGTTCAAG CCGAGATCGG CTTCCCTG CAA AGT CCT GTG GGT GAG TCG AAC 2236 

Gin Ser Pro Val Gly Glu Ser Asn 
451 455 

TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 2284 
Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala He His Gly Leu Leu Ser 
460 465 470 

GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 2338 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 2398 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 24 58 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 2518 

CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 2578 

CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 2638 

ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 2698 

TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 2758 

CCAACCTTGA GGAATTC 277 5 
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GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CG ATG AGC ATT CTT GGT TTG AAT 4 73 

Met Ser lie Leu Gly Leu Asn 

1 5 

GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG 521 

Gly Ala Pro Val Gly Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 

10 15 20 

AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG 569 
Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 

AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA 617 
Ser Arg Leu Asp Arg Ala lie Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 

ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA 665 
lie Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 
60 65 70 

ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 
Thr Leu Leu Cys Asp lie Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 

CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 761 
Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 

TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 809 
Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
105 110 115 

GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 857 
Gly Val lie Ser Pro Trp Asn Phe Pro lie Val Leu Ala Phe Gly Pro 
120 125 130 135 

CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC 905 
Leu Ala Gly He Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 
140 145 150 

GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT 953 
Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu He Ala Arg 
155 160 165 — 
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TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 1001 
Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 

GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 104 9 

Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu lie Phe Thr Gly 
185 190 195 

GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 
Gly Thr Ala Val Ala Lys His lie Met Arg Ala* Ala Ala Asp Asn Leu 
200 205 210 215 

GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 114 5 

Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val lie Val Ser 
220 225 230 

CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 
Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 
235 240 245 

ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CC GTG GGT GAG TCG AAC 124 0 

Thr Phe Asn Ala Gly Gin He Cys Leu Ala Val Gly Glu Ser Asn 
250 255 257 454 455 

TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 1288 
Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala He His Gly Leu Leu Ser 
460 465 470 

GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 134 2 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 14 02 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 14 62 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 1522 

CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 1582 

CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 164 2 

ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 1702 

TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 17 62 

CCAACCTTGA GGAATTC 177 9 



FIG. 2f: 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT HCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC -300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356 

Met Arg Ser Leu Glu 
1 5 

GCG CTT CTT CCC TTC CCG GGT CGA AT"P* CTT GAG CGT CTC GAG CAT TGG 4 04 

Ala Leu Leu Pro Phe Pro Gly Arg lie Leu Glu Arg Leu Glu His Trp 
10 15 20 

GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 4 52 

Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 
25 30 35 

GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 
Gly Glu Trp Arg Arg lie Ser Tyr Ala Glu Met Phe His Asn Val Arg 
40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 54 8 

Ala lie Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 
55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 
Leu Leu lie Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 
70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly lie Pro Tyr Cys Pro Val Ser Pro Ala Tyr 
90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 
Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His lie Val Gly Leu 
105 110 115 

CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG 740 
Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin 
120 125 130 132 

ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC 800 

AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGG ATC TG AT GGCGCAGGGG ATCAAGATCT 860 

G ATC AAG AG A CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC 914 

Met lie Glu Gin Asp Gly Leu His 
1 5 

GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG 962 
Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp 
10 15 20 ^ 
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GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA 1010 
Ala Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser 
25 30 35 40 

GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC 1058 
Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala 
45 50 55 

CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG 1106 
Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr 
60 65 70 

ACG GGC GTT CCT TGC GCA GCT GTG CTC GAG GTT GTC ACT GAA GCG GGA 1154 
Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly 
75 80 85 

AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA 1202 
Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser 
90 95 100 

TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG 1250 
Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met Ala Asp Ala Met 
105 110 115 120 

CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA 1298 
Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin 
125 130 135 

GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT 134 6 

Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu 
140 145 150 

GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC 1394 
Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala 
155 160 165 

GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC 14 4 2 

Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu 
170 175 180 

GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT 14 90 

Val Val Thr His Gly Asp Ala Cys Leu Pro Asn lie Met Val Glu Asn 
185 190 195 200 

GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC 1538 
Gly Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu Gly Val Ala Asp 
205 210 215 

CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT 158 6 

Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He Ala Glu Glu Leu 
220 225 230 

GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT 1634 
Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala Ala 
235 240 245 
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CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC 1682 
Pro Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 
250 255 260 264 

TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCCT GTT TTG CAA 1737 

Val Leu Gin 
563 565 



TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC 1785 
Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly Glu Asp Gin Ser 
570 575 580 

ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC 1832 
Met Leu Arg Asp Glu Ala Thr Leu 
585 589 



TCGGCGTTTT CCGACACTGC GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG 18 92 

GGTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG 1952 

ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA 2012 

GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG 2072 

TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG 2132 

GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG CTGCAG 2188 



FIG. 2g: 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356 

Met Arg Ser Leu Glu 
1 5 

GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG 404 
Ala Leu Leu Pro Phe Pro Gly Arg lie Leu Glu Arg Leu Glu His Trp 
10 15 20 

GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 4 52 

Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 
25 30 35 

GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 
Gly Glu Trp Arg Arg lie Ser Tyr Ala Glu Met Phe His Asn Val Arg 
40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 54 8 

Ala lie Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 
55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 
Leu Leu lie Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 
70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly lie Pro Tyr Cys Pro Val Ser Pro Ala Tyr 
90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 
Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His He Val Gly Leu 
105 HO 115 



CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG 7 40 
Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin 
120 125 130 132 

GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT 800 

GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC 8 60 

CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA 920 

CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC 980 

TCACGCAACT GGT CC AG AAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT 104 0 

TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA 1100 
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GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC 1155 

Met Leu Arg 
1 

AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA 1203 
Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu 
5 10 15 

GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC 1251 
Gly Gly Ser Ser Met Gly lie lie Arg Thr Cys Arg Leu Gly Pro Asp 
20 25 30 35 

CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC 1299 
Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe 
40 45 50 

GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC 134 7 

Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu 
55 60 65 

GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC 1395 
Gly Asn Leu Leu Arg Ser Lys Thr Phe He Ala Leu Ala Ala Phe Asp 
70 75 80 

CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT 14 43 

Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe 
85 90 95 

GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC 14 91 

Glu Gin Pro Arg Ser Glu He Tyr He Tyr Asp Leu Ala Val Ser Gly 
100 105 110 H5 

GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG 1539 
Glu His Arg Arg Gin Gly He Ala Thr Ala Leu He Asn Leu Leu Lys 
120 125 130 

CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT 1587 
His Glu Ala Asn Ala Leu Gly Ala Tyr Val He Tyr Val Gin Ala Asp 
135 140 145 

TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG 1635 
Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly He Arg 
150 155 160 

GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA 1683 
Glu Glu Val Met His Phe Asp He Asp Pro Ser Thr Ala Thr 
165 170 175 177 

TTCGTTCAAG CCGAGATCGG CTTCCCCT GTT TTG CAA TGG CGG TCG GCG AAA 1735 

Val Leu Gin Trp Arg Ser Ala Lys 
563 565 570 

GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC ATG CTG CGT GAC GAG 1783 
Val Asp Ala Leu Tyr Arg Gly Glu Asp Gin Ser Met Leu Arg Asp Glu 
575 580 585 
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GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 1835 
Ala Thr Leu 
589 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 1895 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 1955 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 2015 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 207 5 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 2135 

AGGCGCTGAT CACGTGCTGT GTGTCGCGGG CTGCAG 2171 
FIG . 2h: 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356 

Met Arg Ser Leu Glu 
1 5 

GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG 4 04 

Ala Leu Leu Pro Phe Pro Gly Arg lie Leu Glu Arg Leu Glu His Trp 
10 15 20 

GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 4 52 

Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 
25 30 35 

GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 
Gly Glu Trp Arg Arg He Ser Tyr Ala Glu Met Phe His Asn Val Arg 
40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 54 8 

Ala He Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 
55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 
Leu Leu lie Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 
70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly He Pro Tyr Cys Pro Val Ser Pro Ala Tyr 
90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 
Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His He Val Gly Leu 
105 110 115 

CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG CGC 740 
Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin Arg 
120 125 130 133 

GCT GTT TTG CAA TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT 7 88 

Ala Val Leu Gin Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly 

562 565 570 575 

GAA GAT CAA TCC ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG 837 
Glu Asp Gin Ser Met Leu Arg Asp Glu Ala Thr Leu 
580 585 589 

GGGGGCTTAC TCGGCGTTTT CCGACACTGC GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT 897 



TGATTGCGGG GGTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGT££CTCG 957 
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CGAAGTTCTG ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC 1017 

TATGGCTCAA GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG 1077 

TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT 1137 

GCTTCGGCAG GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG 1197 

CTGCAG 1203 
FIG . 2i: 
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GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 290 

Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
15 10 



GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 
Val Glu Glu Gly lie Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 
15 20 25 30 



AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 
35 40 45 



GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 



GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 70 75 



ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGACAGC 531 
Thr Asp Ala Gly Pro Glu lie Leu Gin Glu Lys lie Arg 
80 85 90 91 



AAGCGAACCG GAATTGCCAG CTGGGGCGCC CTCTGGTAAG GTTGGGAAGC CCTGCAAAGT 591 

AAACTGGATG GCTTTCTTGC CGCCAAGGAT CTGATGGCGC AGGGGATCAA GATCTGATCA 651 

AGAGACAGGA TGAGGATCGT TTCGC ATG ATT GAA CAA GAT GGA TTG CAC GCA 703 

Met lie Glu Gin Asp Gly Leu His Ala 
1 5 



GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG GCA 751 
Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp Ala 
10 15 20 25 



CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA GCG 7 99 

Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser Ala 

30 35 40 

CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC CTG 8 47 

Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala Leu 

45 * 50 55 



AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG ACG 
Asn Glu Leu Gin Asp Glu Ala Ala Arg Lou Ser Trp Leu Ala Thr Thr 
60 65 70 



895 
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GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA AGG 94 3 

Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly Arg 
75 80 85 

GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA TCT 991 
Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser Ser 
90 95 100 105 

CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG CGG 1039 
His Leu Ala Pro Ala Glu Lys Val Ser lie Met Ala Asp Ala Met Arg 
110 115 120 

CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA GCG 1087 
Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin Ala 
125 130 135 

AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT GTC 1135 
Lys His Arg lie Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu Val 
140 145 150 

GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC GAA 118 3 

Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala Glu 
155 160 165 

CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC GTC 1231 
Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu Val 
170 175 180 185 

GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT GGC 127 9 

Val Thr His Gly Asp Ala Cys Leu Pro Asn lie Met Val Glu Asn Gly 
190 195 200 

CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC CGC 1327 
Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu Gly Val Ala Asp Arg 
205 210 215 

TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT GGC 1375 
Tyr Gin Asp lie Ala Leu Ala Thr Arg Asp lie Ala Glu Glu Leu Gly 
220 225 230 

GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT CCC 14 2 3 

Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly lie Ala Ala Pro 
235 240 245 

GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC TGA 14 71 

Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 
250 255 260 264 

GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC CC GAG CAG GGC ATG 1525 

Glu Gin Gly Met 
255 

AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG ACC TAC 157 3 

Lys Gin Phe Leu Asp Glu Lys Ser lie Lys Pro Gly Leu Gin Thr Tyr 
260 265 270 
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AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA TAATGACAAT 1632 
Lys Arg 
275 276 

AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA 1692 

TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC 1752 

GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT 1812 

GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT 1872 

CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC 1932 

TGGTATGGGT TTAACGTTTA CCTGGCGGCG GGCATGTTGC GGGGAATTC 1981 
FIG . 2j: 
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GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 290 
Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
15 10 

GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 
Val Glu Glu Gly lie Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 
15 20 25 30 

AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 
35 40 45 

GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 

GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 70 75 

ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGGAGAG 531 
Thr Asp Ala Gly Pro Glu He Leu Gin Glu Lys He Arg 
80 85 90 91 

GCGGTTTGCG TATTGGGCGC ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA 591 

CATGGAAGCC ATCACAAACG GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT 651 

CGCCTTGCGT ATAATATTTG CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC 711 

CCAGTTGACA TAAGCCTGTT CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG 771 

CAACTGGTCC AGAACCTTGA CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT 831 

GGCTTGTTAT GACTGTTTTT TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG 891 

TTACGCCGTG GGTCGATGTT TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC 94 7 

Met Leu Arg Ser Ser 
1 5 

AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC 995 
Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly 
10 15 20 

TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC 104 3 

Scr Ser Mel Gly Tie He Arg Thr Cys Arg Leu Gly Pro Asp Gin Val 
25 30 35 
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AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC 1091 
Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp 
40 45 50 

GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC 1139 
Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn 
55 60 65 

TTG CTC CGT AGT AAG AC A TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA 1187 
Leu Leu Arg Ser Lys Thr Phe lie Ala Leu Ala Ala Phe Asp Gin Glu 
70 75 80 85 

GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG 1235 
Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin 
90 95 100 

CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC 1283 
Pro Arg Ser Glu lie Tyr lie Tyr Asp Leu Ala Val Ser Gly Glu His 
105 110 115 

CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG 1331 
Arg Arg Gin Gly lie Ala Thr Ala Leu lie Asn Leu Leu Lys His Glu 
120 125 130 

GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT 137 9 

Ala Asn Ala Leu Gly Ala Tyr Val lie Tyr Val Gin Ala Asp Tyr Gly 
135 140 145 

GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA 14 27 

Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly lie Arg Glu Glu 
150 155 160 165 

GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC 14 7 6 

Val Met His Phe Asp lie Asp Pro Ser Thr Ala Thr 
170 175 177 

AAGCCGAGAT CGGCTTCCCC GAG CAG GGC ATG AAG CAG TTC CTT GAC GAG 1526 

Glu Gin Gly Met Lys Gin Phe Leu Asp Glu 
255 260 

AAA AGC ATC AAG CCG GGC TTG CAG ACC TAC AAG CGC TGA TAAATGCGCC 1575 

Lys Ser lie Lys Pro Gly Leu Gin Thr Tyr Lys Arg 

265 270 275 276 

GGGGCCCTCG CTGCGCCCCC GGCGTTCCAA TAATGACAAT AATGAGGAGT GCCCAATGTT 1635 

TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA TCTGATGAGC GCACCTTCGA 1695 

GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA 17 55 

TGCGGJKCGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT GAATGGGCGG CGCTTGCTCC 1815 



GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT CTAGAGGACC GTTCTTCCGA 1875 
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GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC TGGTATGGGT TTAACGTTTA 1935 
CCTGGCGGCG GGCATGTTGC GGGGAATTC 1964 
FIG . 2k: 



WO 00/26355 



30 



PCT/EP99/07952 



G AAT TCCCC T GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 2 90 

Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
15 10 

GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 
Val Glu Glu Gly lie Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 
15 20 25 30 

AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 
35 40 45 

GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 

GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 70 75 

ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGC GAG CAG 530 
Thr Asp Ala Gly Pro Glu lie Leu Gin Glu Lys lie Arg Arg Glu Gin 
80 85 90 92 255 

GGC ATG AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG 578 
Gly Met Lys Gin Phe Leu Asp Glu Lys Ser lie Lys Pro Gly Leu Gin 
260 265 270 

ACC TAC AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA 633 
Thr Tyr Lys Arg 
275 276 

TAATGACAAT AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC 693 

TTGTTCAGCA TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT 753 

ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC 813 

TGCGTTTCCT GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC 873 

GGCGGATCTT CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC 933 

AGCGGGAAAC TGGTATGGGT TTAACGTTTA CCTGGCGGCG GGCATGTTGC GGGGAATTC 992 
PIG . 21: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55 

Met Phe His Val Pro Leu Leu 
1 5 

ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 
lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 
10 15 20 

CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 
Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 
25 30 35 

TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 
Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 
40 45 50 55 

GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 24 7 

Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 
60 65 70 

GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 2 95 

Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 
75 80 85 

AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 34 3 

Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 
90 95 100 

GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC AC A CAG ATT CAG 391 
Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin lie Gin 
105 110 115 

GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 4 39 

Gly Asp Val lie Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 
120 125 130 135 

CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 4 87 

Arg Gin Pro Cys Gly Val Val Leu Gly lie Ala Pro Trp Asn Ala Pro 
140 145 150 

GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 
Val He Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 
155 160 165 

ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 58 3 

Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 
170 175 180 

ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 
He Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 
185 190 195 



GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 
Val He Sor Asn Ala Pro GJ n Asp Ala Pro Ala Val Val Glu Arg Leu 
200 205 210 215 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 
He Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 
220 225 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 775 
Val Gly Arg He He Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 
235 240 245 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC -823 
Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 
250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 
Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 
265 270 275 

CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 
Gin Gly Gin He Cys Met Ser Thr Glu Arg Leu He Val Thr Ala Val 
280 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 
Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu He Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GGG 1063 
Ala Asn Ala Gly Gin Arg He Gin Val Leu Val Asp Asp Ala Leu 
330 335 340 342 

GACAGCAAGC GAACCGGAAT TGCCAGCTGG GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG 1123 

CAAAGTAAAC TGGATGGCTT TCTTGCCGCC AAGGATCTGA TGGCGCAGGG GATCAAGATC 118 3 

TGATCAAGAG ACAGGATGAG GATCGTTTCG C ATG ATT GAA CAA GAT GGA TTG 1235 

Met He Glu Gin Asp Gly Leu 
1 5 

CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC 1283 
His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp 
10 15 20 

TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG 1331 
Trp Ala Gin Gin Thr He Gly Cys Ser Asp Ala Ala Val Phe Arg Leu 
25 30 35 

TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT 137 9 

Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly 
40 45 50 55 

GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC 14 27 

Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala 
60 65 70 
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ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG 14 75 

Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala 
75 80 85 

GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG 1523 
Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu 
90 95 100 

TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA 1571 
Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met Ala Asp Ala 
105 110 115 

ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC 1619 
Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His 
120 125 130 135 

CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT 1667 
Gin Ala Lys His Arg He Glu Arg Ala Arg Thr Arg Met Glu : Ala Gly 
140 145 150 

CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA 1715 
Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro 
155 160 165 

GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT 17 63 

Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp 
170 175 180 

CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA 1811 
Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn He Met Val Glu 
185 190 195 

AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG 1859 
Asn Gly Arg Phe Ser Gly Phe He Asp Cys Gly Arg Leu Gly Val Ala 
200 205 210 215 

GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG 1907 
Asp Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He Ala Glu Glu 
220 225 230 

CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC 1955 
Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala 
235 240 245 

GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC 2003 
Ala Pro Asp Ser Gin Arg He Ala Phe Tyr Arg Leu Leu Asp Glu Phe 
250 255 260 

TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC CG GCC CAG 2057 
Phe Ala Gin 

264 421 

CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT GTG CAT GAC 2105 
Arg Val Asp Ser Gly He Cys His lie Asn Gly Pro Thr Val His Asp 
425 430 435 



WO 00/26355 



34 



PCT/EP99/07952 



GAG GCT CAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC TAC GGC AGC 2153 
Glu Ala Gin Met Pro Phe Gly Gly Val Lys Ser Ser Gly Tyr Gly Ser 
440 445 450 

TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG CGC TGG CTG 2201 
Phe Gly Ser Arg Ala Ser He Glu His Phe Thr Gin Leu Arg Trp Leu 
455 460 465 470 

ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA ATCGATCTTC 224 7 

Thr He Gin Asn Gly Pro Arg His Tyr Pro He 
475 480 481 

GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA CTTGATAAAA 2307 

ACAGAGCTGT TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG 2367 

AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCATGCTC TGCTCAGCCA 24 27 

CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA CGCTGGAGGT 2487 

ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT TC 2 539 

FIG - 2m: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55 

Met Phe His Val Pro Leu Leu 
1 5 

ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 
lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 
10 15 20 

CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 
Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 
25 30 35 

TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 
Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 
AO 45 50 55 

GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 24 7 

Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 
60 65 70 

GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 2 95 

Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 
75 80 85 

AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 34 3 

Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 
90 95 100 

GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 391 
Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin lie Gin 
105 110 115 

GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 4 39 

Gly Asp Val lie Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 
120 125 130 135 

CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 4 87 

Arg Gin Pro Cys Gly Val Val Leu Gly He Ala Pro Trp Asn Ala Pro 
140 145 150 

GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 
Val He Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 
155 160 165 

ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 583 
Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 
170 175 180 

ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 
He Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 
185 190 195 



GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 
Val He Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 
200 205 210 215 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 
He Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 
220 225 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 775 
Val Gly Arg He He Gly Glu Leu Ser Ala Arg His Leu. Lys Pro Ala 
235 240 245"^ 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC .823 
Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 
250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 
Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 
265 270 275 

CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG AC A GCA GTC 919 
Gin Gly Gin He Cys Met Ser Thr Glu Arg Leu He Val Thr Ala Val 
280 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC AC A CTG CGT 967 
Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu He Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTGGGGAGAG GCGGTTTGCG TATTGGGCGC 1069 
Ala Asn Ala Gly Gin Arg He Gin 
330 335 

ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG 1129 

GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT AT AAT ATT TG 118 9 

CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT 124 9 

CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA 1309 

CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT 1369 

TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT 14 29 

TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG 14 80 

Met Leu Arg Ser Ser Asn Asp Val Thr Gin 
15 10 

CAG GGC AGT CGC CCT AAA AC A AAG TTA GGT GGC TCA AGT ATG GGC ATC 1528 
Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly Ser Ser Met Gly He 
15 20 25 

ATT CGC ACA TGT AGG CTC GGf CCT GAC CAA GTC AAA TCC ATG CGG GCT 157 6 

He Arg Thr Cys Arg Leu Gly Pro Asp Gin Val Lys Ser Met Arg Ala 
30 35 40 
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GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC 1624 
Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser 
45 50 55 

CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG 1672 
Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys 
60 65 70 

ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT 1720 
Thr Phe lie Ala Leu Ala Ala Phe Asp Gin Glu Ala Val Val Gly Ala 
75 80 85 90 

CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC 17 68 

Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin Pro Arg Ser Glu lie 
95 100 105 

TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT 1816 
Tyr lie Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gin Gly lie 
110 115 120 

GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT 18 64 

Ala Thr Ala Leu lie Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly 
125 130 135 

GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG 1912 
Ala Tyr Val He Tyr Val Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val 
140 145 150 

GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT 1960 
Ala Leu Tyr Thr Lys Leu Gly He Arg Glu Glu Val Met His Phe Asp 
155 160 165 170 

ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA 2014 
He Asp Pro Ser Thr Ala Thr 
175 177 

A TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT 2063 
Leu Ala Gin Arg Val Asp Ser Gly He Cys His He Asn Gly Pro Thr 
420 425 430 435 

GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC 2111 
Val His Asp Glu Ala Gin Met Pro Phe Gly Gly Val Lys Ser Ser Gly 
440 445 450 

TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG 2159 
Tyr Gly Ser Phe Gly Ser Arg Ala Ser He Glu His Phe Thr Gin Leu 
455 460 465 

CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA 2204 
Arg Trp Leu Thr He Gin Asn Gly Pro Arg His Tyr Pro He 
470 475 480 481 

ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA 2264 



CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT 232 4 
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CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCA TGCTC 2384 

TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA 24 4 4 

CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT 2504 

XC 2506 
FIG. 2n: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55 

Met Phe His Val Pro Leu Leu 
1 5 

ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 
lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 
10 15 20 

CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 
Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 
25 30 35 

TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 
Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 
40 45 50 55 

GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 24 7 

Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 
60 65 70 

GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 295 
Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 
75 80 85 

AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 34 3 

Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 
90 95 100 

GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 391 
Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin lie Gin 
105 110 115 

GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 4 39 

Gly Asp Val lie Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 
120 125 130 135 

CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 4 87 

Arg Gin Pro Cys Gly Val Val Leu Gly lie Ala Pro Trp Asn Ala Pro 
140 145 150 

GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 
Val lie Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 
155 160 165 

ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 58 3 

Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 
170 175 180 

ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 
He Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 
185 190 195 



GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 
Val He Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 
200 205 210 215 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 
lie Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 

220 225 ** 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 77 5 

Val Gly Arg lie lie Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 
235 240 245 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 
Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 
250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 
Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 
265 270 275 

CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG AC A GCA GTC 919 
Gin Gly Gin He Cys Met Ser Thr Glu Arg Leu He Val Thr Ala Val 
280 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 
Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu He Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GCA 1063 
Ala Asn Ala Gly Gin Arg He Gin Val Leu Val Asp Asp Ala Leu Ala 
330 335 340 

AAA GGC GCG CAATGGAA TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT 1113 
Lys Gly Ala Leu Ala Gin Arg Val Asp Ser Gly lie Cys His 

345 346 420 425 430 

ATC AAT GGA CCG ACT GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG 1161 
He Asn Gly Pro Thr Val His Asp Glu Ala Gin Met Pro Phe Gly Gly 
435 440 445 

GTG AAG TCC AGC GGC TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG 1209 
Val Lys Ser Ser Gly Tyr Gly Ser Phe Gly Ser Arg Ala Ser He Glu 
450 455 460 

CAC TTT ACC CAG CTG CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC 12 57 

His Phe Thr Gin Leu Arg Trp Leu Thr He Gin Asn Gly Pro Arg His 
465 470 475 

TAT CCA ATC TAA ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT 1309 
Tyr Pro He 
480 481 

CGCCTCATTT CAATCTCTAA CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA 1369 
AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA 14 29 
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CCGCAGGCAT CATCATGCTC TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT 14 89 

CCGGTTGAGG TTACGCAAGA CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT 154 9 

CTTCCCTTCC CGGGTGGAAT TC '1571 
FIG . 2o: 
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GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC C AC ACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112 
Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
15 10 

GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp lie Asp Cys Gly 
15 20 25 

GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 
Gly Ala Leu Ser Leu Val Ser Pro lie Asp Leu Gly Val Lys Val Ala 
30 35 40 

CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC 256 
Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 
45 50 55 60 

GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 304 
Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 
65 70 75 

CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 
Pro Arg His lie Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 
80 85 90 

TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG 4 00 

Leu Gly Val Gin Arg lie Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 
95 100 105 

GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 448 
Ala Gly Glu Gin lie Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 
110 115 120 

GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 4 96 

Ala Glu Ser Met Ser Arg Asn Pro lie Ala Ser Tyr Thr His Arg Gly 
125 130 135 140 

GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 54 4 

Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 
145 150 155 

GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 592 
Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met lie Ala Thr Ala Glu 
160 165 170 

AAC CTG GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT 64 8 

Asn Leu 
174 

TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 708 

GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA 7 63 

Met He Glu Gin 
I 
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GAT GGA TTG CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC 811 
Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe 
5 10 15 20 

GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG 8 59 

Gly Tyr Asp Trp Ala Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val 
25 30 35 

TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC .907 
Phe Arg Leu Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp 
40 45 50 

CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG 955 
Leu Ser Gly Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser 
55 60 65 

TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC 1003 
Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val 
70 75 80 

ACT GAA GCG GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG 1051 
Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin 
85 90 95 100 

GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG 1099 
Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met 
105 110 115 

GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA 114 7 

Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro 
120 125 130 

TTC GAC CAC CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG 1195 
Phe Asp His Gin Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met 
135 140 145 

GAA GCC GGT CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG 124 3 

Glu Ala Gly Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly 
150 155 160 

CTC GCG CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC 1291 
Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 
165 170 175 180 

GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC 1339 
Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn lie 
185 190 195 

ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG 1387 
Met Val Glu Asn Gly Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu 
200 205 210 

GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT 14 35 

Gly Val Ala Asp Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He 
215 220 225 
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GCT GAA GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC 14 83 

Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr 
230 235 240 

GGT ATC GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT 1531 
Gly lie Ala Ala Pro Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu 
245 250 255 260 

GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 158 6 

Asp Glu Phe Phe 
264 

CA TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG ATC GTG GCT 1633 
Leu Arg Ala Gin Glu Glu Lys Trp He Asp Gin Glu He Val Ala 
197 200 205 210 

GTT ACG GAT GAA CAG TTC GAT TTA GAG GGC TAC AAC AGT CGA GCA ATT 1681 
Val Thr Asp Glu Gin Phe Asp Leu Glu Gly Tyr Asn Ser Arg Ala He 
215 220 225 

GAA CTG CCT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC ATC CGC GGC 172 9 

Glu Leu Pro Arg Lys Ala Lys Leu Leu lie Val Thr Val He Arg Gly 
230 235 240 

CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT CAT TCT GGC 1777 
Leu Ala Val Phe Glu Ala Leu Ser Arg Leu Lys Pro Val His Ser Gly 
245 250 255 

GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC GGC GCC GCG 1825 
Gly Val Gin Thr Ala Gly Asn Ser Cys Ala Val Val Asp Gly Ala Ala 
260 265 270 275 

GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG GTC TTG GCT 1873 
Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gin Pro Val Leu Ala 
280 285 290 

AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG CAT ATG GGG 1921 
Arg He Leu Ala Thr Ser Val Val Gly He Glu Pro Glu His Met Gly 
295 300 305 

CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT AGT GAT CTT 1969 
Leu Gly Pro Ala Pro Ala He Arg Leu Leu Leu Ala Arg Ser Asp Leu 
310 315 320 

AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG CAG GCC GCC 2017 
Ser Leu Arg Asp He Asp Leu Phe Glu He Asn Glu Ala Gin Ala Ala 
325 330 335 

CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC TCA AAA CTT 2065 
Gin Val Leu Ala Val Gin His Glu Leu Gly He Glu His Ser Lys Leu 
340 345 350 355 

AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT GCC GCG ACC 2113 
Asn He Trp Gly Gly Ala He Ala Leu Gly His Pro Leu Ala Ala Thr 
360 365 370 
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GGA TTG CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA GCT AAT AAC 2161 
Gly Leu Arg Leu Cys Met Thr Leu Ala His Gin Leu Gin Ala Asn Asn 
375 380 385 

TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA CAG GGG ATG 2209 
Phe Arg Tyr Gly He Ala Ser Ala Cys He Gly Gly Gly Gin Gly Met 
390 395 400 

GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT GCA CGA AGT 2257 
Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser Ala Arg Ser 
405 410 415 

TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA CGGGCATCTC 2306 
Ser Met He Asn Arg Val Asp His Tyr Pro Leu Ser 
420 425 430 431 

CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA 2366 

GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT 24 26 

AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT 24 86 

TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC 252 6 



FIG. 2p: 
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GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112 

Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
15 10 

GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp lie Asp Cys Gly 
15 20 25 

GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 
Gly Ala Leu Ser Leu Val Ser Pro lie Asp Leu Gly Val Lys Val Ala 
30 35 40 

CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC 2 56 

Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 
45 50 55 60 

GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 304 
Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 
65 70 75 

CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 
Pro Arg His lie Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 
80 85 90 

TTG GGG GTG CAG CGC ATT TGC GGC AC A GGC TTC GAA CTG CTT CGG CAG 4 00 

Leu Gly Val Gin Arg lie Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 
95 100 105 

GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 448 
Ala Gly Glu Gin lie Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 
110 115 120 

GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT AC A CAC CGG GGC 4 96 

Ala Glu Ser Met Ser Arg Asn Pro lie Ala Ser Tyr Thr His Arg Gly 
125 130 135 140 

GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 54 4 

Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 
145 150 155 

GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 592 
Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met lie Ala Thr Ala Glu 
160 165 170 

AAC CTG GGGGAGAGGC GGTTTGCGTA TTGGGCGCAT GCATAAAAAC TGTTGTAATT 64 8 
Asn Leu 
174 

CATTAAGCAT TCTGCCGACA TGGAAGCCAT CACAAACGGC ATGATGAACC TGAATCGCCA 708 

GCGGCATCAG CACCTTGTCG CCTTGCGTAT AATATTTGCC CATGGACGCA CACCGTGGAA 7 68 

ACGGATGAAG GCACGAACCC AGTTGACATA AGCCTGTTCG GTTCGTAAAC TGTAATGCAA 828 



GTAGCGTATG CGCTCACGCA ACTGGTCCAG AACCTTGACC GAACGCAGCG GTGGTAACGG 888 
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CGCAGTGGCG GTTTTCATGG CTTGTTATGA CTGTTTTTTT GTACAGTCTA TGCCTCGGGC 948 

ATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTTTG ATGTTATGGA GCAGCAACG 1007 

ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA 1055 
Met Leu Arg Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys 
15 10 15 

ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC 1103 
Thr Lys Leu Gly Gly Ser Ser Met Gly lie lie Arg Thr Cys Arg Leu 
20 25 30 

GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT 1151 
Gly Pro Asp Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly 
35 40 45 

CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC 1199 
Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser 
50 55 60 

GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT 124 7 

Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys Thr Phe lie Ala Leu Ala 
65 70 75 80 

GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG 1295 
Ala Phe Asp Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu 
85 90 95 

CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA 134 3 

Pro Arg Phe Glu Gin Pro Arg Ser Glu lie Tyr lie Tyr Asp Leu Ala 
100 105 110 

GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT 1391 
Val Ser Gly Glu His Arg Arg Gin Gly lie Ala Thr Ala Leu He Asn 
115 120 125 

CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG 14 39 

Leu Leu Lys His Glu Ala Asn Ala Leu Gly Ala Tyr Val He Tyr Val 
130 135 140 

CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG 14 87 

Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu 
145 150 155 160 

GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC 1535 
Gly He Arg Glu Glu Val Met His Phe Asp He Asp Pro Ser Thr Ala 
165 170 175 

ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA TTG AGG. GCG CAA GAG GAG 158 9 

Thr Leu Arg Ala Gin Glu Glu 

177 197 200 



AAA TGG ATT GAC CAA GAG ATC GTG GCT GTT ACG GAT GAA CAG TTC GAT 
Lys Trp He Asp Gin Glu He Val Ala Val Thr Asp Glu Gin Phe Asp 
205 210 215 



1637 
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TTA GAG GGC TAG AAC AGT CGA GCA ATT GAA CTG CCT CGG AAG GCA AAA 168 5 

Leu Glu Gly Tyr Asn Ser Arg Ala lie Glu Leu Pro Arg Lys Ala Lys 
220 225 230 

TTG TTG ATC GTG ACA GTC ATC CGC GGC CTA GCA GTC TTT GAA GCC CTT 17 33 

Leu Leu lie Val Thr Val lie Arg Gly Leu Ala Val Phe Glu Ala Leu 
235 240 245 250 

TCC CGA TTG AAG CCT GTT CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC 1781 
Ser Arg Leu Lys Pro Val His Ser Gly Gly Val Gin Thr Ala Gly Asn 
255 260 265 

AGC TGT GCC GTA GTG GAC GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG 1829 
Ser Cys Ala Val Val Asp Gly Ala Ala Ala Ala Leu Val Ala Arg Glu 
270 275 280 

TCG TCT GCG ACA CAG CCG GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA 1877 
Ser Ser Ala Thr Gin Pro Val Leu Ala Arg lie Leu Ala Thr Ser Val 
285 290 295 

GTC GGG ATC GAG CCC GAG CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT 192 5 

Val Gly lie Glu Pro Glu His Met Gly Leu Gly Pro Ala Pro Ala lie 
300 305 310 

CGC CTG CTG CTT GCG CGT AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC 197 3 

Arg Leu Leu Leu Ala Arg Ser Asp Leu Ser Leu Arg Asp lie Asp Leu 
315 320 325 330 

TTT GAG ATA AAC GAG GCG CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT 2021 
Phe Glu lie Asn Glu Ala Gin Ala Ala Gin Val Leu Ala Val Gin His 
335 340 345 

GAA TTG GGT ATT GAG CAC TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT 2069 
Glu Leu Gly lie Glu His Ser Lys Leu Asn lie Trp Gly Gly Ala lie 
350 355 360 

GCA CTT GGA CAC CCG CTT GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC 2117 
Ala Leu Gly His Pro Leu Ala Ala Thr Gly Leu Arg Leu Cys Met Thr 
365 370 375 

CTC GCT CAC CAA TTG CAA GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG 2165 
Leu Ala His Gin Leu Gin Ala Asn Asn Phe Arg Tyr Gly lie Ala Ser 
380 385 390 

GCA TGC ATT GGT GGG GGA CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC 2213 
Ala Cys lie Gly Gly Gly Gin Gly Met Ala Val Leu Leu Glu Asn Pro 
395 400 405 410 

CAC TTC GGT TCG TCC TCT GCA CGA AGT TCG ATG ATT AAC AG A GTT GAC 2261 
His Phe Gly Ser Ser Ser Ala Arg Ser Ser Met He Asn Arg Val Asp 
415 420 425 

CAC TAT CCA CTG AGC TAA CGGGCATCTC CTTTGTTGCT TTGAGGTGGC 2309 
His Tyr Pro Leu Ser 
430 431 
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GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA GAAGGAACAG GGAACATGAT 2369 

TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT AAACTTGCCC TTGCCTTCGC 24 29 

ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT TTCTACAGTG TACATACCTT 24 89 

GTCAGGGTTG GTGGGAATTC 2509 
FIG . 2q: 
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GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112 
Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
15 10 

GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp lie Asp Cys Gly 
15 20 25 

GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 
Gly Ala Leu Ser Leu Val Ser Pro lie Asp Leu Gly Val Lys Val Ala 
30 35 40 

CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC 256 
Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 
45 50 55 60 

GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 304 
Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 
65 70 75 

CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 
Pro Arg His He Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 
80 85 90 

TTG GGG GTG CAG CGC ATT TGC GGC AC A GGC TTC GAA CTG CTT CGG CAG 4 00 

Leu Gly Val Gin Arg He Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 
95 100 105 

GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 4 48 

Ala Gly Glu Gin He Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 
110 115 120 

GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 4 96 

Ala Glu Ser Met Ser Arg Asn Pro He Ala Ser Tyr Thr His Arg Gly 
125 130 135 140 

GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 54 4 

Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 
145 150 155 

GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 592 
Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met He Ala Thr Ala Glu 
160 165 170 

AAC CTG GCG CGC A TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG 641 
Asn Leu Ala Arg Leu Arg Ala Gin Glu Glu Lys Trp He Asp Gin Glu 
175 176 197 200 205 

ATC GTG GCT GTT ACG GAT GAA CAG TTC GAT TTA GAG GGC TAC AAC AGT 68 9 

lie Val Ala Val Thr Asp Glu Gin Phe Asp Leu Glu Gly Tyr Asn Ser 
210 215 220 

CGA GCA ATT GAA CTG CCT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC 737 
Arg Ala T Lc Glu Leu Pro Arg Lys Ala Lys Leu Leu He Val Thr Val 
225 230 235 240 
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ATC CGC GGC CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT 78 5 

lie Arg Gly Leu Ala Val Phe Glu Ala Leu Ser Arg Leu Lys Pro Val 
245 250 255 

CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC 833 
His Ser Gly Gly Val Gin Thr Ala Gly Asn Ser Cys Ala Val Val Asp 
260 265 270 

GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG 881 
Gly Ala Ala Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gin Pro 
275 280 285 

GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG ' 929 

Val Leu Ala Arg lie Leu Ala Thr Ser Val Val Gly lie Glu Pro Glu 
290 295 300 

CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT 97 7 

His Met Gly Leu Gly Pro Ala Pro Ala He Arg Leu Leu Leu Ala Arg 
305 310 315 * 320 

AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG 102 5 

Ser Asp Leu Ser Leu Arg Asp He Asp Leu Phe Glu He Asn Glu Ala 
325 330 335 

CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC 107 3 

Gin Ala Ala Gin Val Leu Ala Val Gin His Glu Leu Gly He Glu His 
340 345 350 

TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT 1121 
Ser Lys Leu Asn He Trp Gly Gly Ala He Ala Leu Gly His Pro Leu 
355 360 365 

GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA 1169 
Ala Ala Thr Gly Leu Arg Leu Cys Met Thr Leu Ala His Gin Leu Gin 
370 375 380 

GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA 1217 
Ala Asn Asn Phe Arg Tyr Gly He Ala Ser Ala Cys He Gly Gly Gly 
385 390 395 400 

CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT 1265 
Gin Gly Met Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser 
405 410 415 

GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA 1313 
Ala Arg Ser Ser Met He Asn Arg Val Asp His Tyr Pro Leu Ser 
420 425 430 431 

CGGGCATCTC CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA 137 3 

AAAACAAGAA GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG 14 33 

AGTCCAGGCT AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC 14 93 

CGGCACGGGT TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC 154 3 
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Sequenz 1 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 
GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 
GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 
CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 
AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 
GCATGGAAAT GGCATGAGCT TTGCTGGATA TG AT TAG AG A CATTAACTAT TTTGGCGGAA 360 
TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 
AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GG AGTGTCCT CCGGT ATCGG 4 80 
TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 54 0 
CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAAGGCAT 600 
CGATAAGGCC ATCGGGACAG CAAGCGAACC GGAATTGCCA GCTGGGGCGC CCTCTGGTAA 660 
GGTTGGGAAG CCCTGCAAAG TAAACTGGAT GGCTTTCTTG CCGCCAAGGA TCTGATGGCG 720 
CAGGGGATCA AGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA TTGAACAAGA 780 
TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT ATGACTGGGC 84 0 
ACAACAGACA ATCGGCTGCT CTGATGCCGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC 900 
GGTTCTTTTT GTCAAGACCG ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC 960 

GCGGCTATCG TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 1020 

TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC 1080 

TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC GGCTGCATAC 114 0 

GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA CATCGCATCG AGCGAGCACG 1200 

TACTCGGATG GAAGCCGGTC TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT 1260 

CGCGCCAGCC GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT 1320 

CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG 1380 

ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG CGTTGGCTAC 14 40 

CCGTGATATT GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC CGCTTCCTCG TGCTTTACGG 1500 

TATCGCCGCT CCCGATTCGC AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG 1560 

AGCGGGACTC TGGGGTTCGA AATGACCGAC CAAGCGACGC CCTGGCCGCG GTGATTGCAT 1620 

TCATGTGTGC TGAGGAGTCA CGTTGGATCA ACGGCATAAA TATTCCAGTG GACGGAGGTT 1680 

TGGCATCGAC CTACGTGTAA GTTCGTGGAC GCCCTTTGCA CGCGCACTAT ATCTCTATGC 17 40 

AGCAGCTGAA AGCAGCTTTG GTTTTGATCG GAGGTAGCGG GCGGAAAGGT GCAGAATGTC 1800 

TAAATAATAA AGGATTCTTG TGAAGCTTTA GTTGTCCGTA AACGAAAATA AAAATAAAGA 18 60 

GGAATGATAT GAAAGCAAGT AGATCAGTCT GCACTTTCAA AATAGCTACC CTGGCAGGCG 1920 

CCATTTATGC AGCGCTGCCA ATGTCAGCTG CAAACTCGAT GCAGCTGGAT GTAGGTAGCT 1980 

CGGATTGGAC GGTGCGTTGG GGACAACACC CTCAAGTATA GCCTTGCCTC TCGCCTGAAT 2040 

GAGCAAGACT CAAGTCTGAC AAATGCGCCG ACTGTCAATG GTTATATCCG GATATTCAAA 2100 

GTCAGGGTGA TCGTAACTTT GACCGGGGGC TTGGTATCCA ATCGTCTCGA TATTCTGGCT 2160 

GCAG 2164 
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Sequent 2 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TG AT TAG AG A CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG 4 80 

TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 54 0 

CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAGGGGAG 600 

AGGCGGTTTG CGTATTGGGC GCATGCATAA AAACTGTTGT AATTCATTAA GCATTCTGCC 660 

GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA TCAGCACCTT 7 20 

GTCGCCTTGC GTATAATATT TGCCCATGGA CGCACACCGT GGAAACGGAT GAAGGCACGA 780 

ACCCAGTTGA CATAAGCCTG TTCGGTTCGT AAACTGTAAT GCAAGTAGCG TATGCGCTCA 84 0 

CGCAACTGGT CCAGAACCTT GACCGAACGC AGCGGTGGTA ACGGCGCAGT GGCGGTTTTC 900 

ATGGCTTGTT ATGACTGTTT TTTTGTACAG TCTATGCCTC GGGCATCCAA GCAGCAAGCG 960 

CGTTACGCCG TGGGTCGATG TTTGATGTTA TGGAGCAGCA ACGATGTTAC GCAGCAGCAA 1020 

CGATGTTACG CAGCAGGGCA GTCGCCCTAA AACAAAGTTA GGTGGCTCAA GTATGGGCAT 1080 

CATTCGCACA TGTAGGCTCG GCCCTGACCA AGTCAAATCC ATGCGGGCTG CTCTTGATCT 114 0 

TTTCGGTCGT GAGTTCGGAG ACGTAGCCAC CTACTCCCAA CATCAGCCGG ACTCCGATTA 1200 

CCTCGGGAAC TTGCTCCGTA GTAAGACATT CATCGCGCTT GCTGCCTTCG ACCAAGAAGC 12 60 

GGTTGTTGGC GCTCTCGCGG CTTACGTTCT GCCCAGGTTT GAGCAGCCGC GTAGTGAGAT 1320 

CTATATCTAT GATCTCGCAG TCTCCGGCGA GCACCGGAGG CAGGGCATTG CCACCGCGCT 1380 

CATCAATCTC CTCAAGCATG AGGCCAACGC GCTTGGTGCT TATGTGATCT ACGTGCAAGC 14 40 

AGATTACGGT GACGATCCCG CAGTGGCTCT CTATACAAAG TTGGGCATAC GGGAAGAAGT 1500 

GATGCACTTT GATATCGACC CAAGTACCGC CACCTAACAA TTCGTTCAAG CCGAGATCGG 1560 

CTTCCCTGAT TGCATTCATG TGTGCTGAGG AGTCACGTTG GATCAACGGC ATAAATATTC 1620 

CAGTGGACGG AGGTTTGGCA TCGACCTACG TGTAAGTTCG TGGACGCCCT TTGCACGCGC 1680 

ACTATATCTC TATGCAGCAG CTGAAAGCAG CTTTGGTTTT GATCGGAGGT AGCGGGCGGA 1740 

AAGGTGCAGA ATGTCTAAAT AATAAAGGAT TGTTGTGAAG CTTTAGTTGT CCGTAAACGA 1800 

AAATAAAAAT AAAGAGGAAT GATATGAAAG CAAGTAGATC AGTCTGCACT TTCAAAATAG 18 60 

CTACCCTGGC AGGCGCCATT TATGCAGCGC TGCCAATGTC AGCTGCAAAC TCGATGCAGC 1920 

TGGATGTAGG TAGCTCGGAT TGGACGGTGC GTTGGGGACA ACACCCTCAA GTATAGCCTT 1980 

GCCTCTCGCC TGAATGAGCA AGACTCAAGT CTGACAAATG CGCCGACTGT CAATGGTTAT 204 0 

ATCCGGATAT TCAAAGTCAG GGTGATCGTA ACTTTGACCG GGGGCTTGGT ATCCAATCGT 2100 

CTCGATATTC TGGCTGCAG 2119 
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Sequenz 3 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACQ ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 2Q 

AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG 4 80 

TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 54 0 

CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAAGGCAT 600 

CGATCAACGG CATAAATATT CCAGTGGACG GAGGTTTGGC ATCGACCTAC GTGTAAGTTC 660 

GTGGACGCCC TTTGCACGCG CACTATATCT CTATGCAGCA GCTGAAAGCA GCTTTGGTTT 720 

TGATCGGAGG TAGCGGGCGG AAAGGTGCAG AATGTCTAAA TAATAAAGGA TTCTTGTGAA 780 

GCTTTAGTTG TCCGTAAACG AAAATAAAAA TAAAGAGGAA TGATATGAAA GCAAGTAGAT 84 0 

CAGTCTGCAC TTTCAAAATA GCTACCCTGG CAGGCGCCAT TTATGCAGCG CTGCCAATGT 900 

CAGCTGCAAA CTCGATGCAG CTGGATGTAG GTAGCTCGGA TTGGACGGTG CGTTGGGGAC 960 

AACACCCTCA AGTATAGCCT TGCCTCTCGC CTGAATGAGC AAGACTCAAG TCTGACAAAT 1020 

GCGCCGACTG TCAATGGTTA TATCCGGATA TTCAAAGTCA GGGTGATCGT AACTTTGACC 1080 

GGGGGCTTGG TATCCAATCG TCTCGATATT CTGGCTGCAG 1120 
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Seqxienz 4 

GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGG TGCCCt 4 80 

CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC 54 0 

AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 

TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 

AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 

ACGTGGCCAA ATGGATGGAG CCCGAACATC ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC 780 

GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG 84 0 

TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 

CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 

ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 

AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 

CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG 114 0 

TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 

ATGCCGGGCA AATCTGTCTG GCACCGGACT ATGTGCTGCT GCCGGAAGGG ACAGCAAGCG 12 60 

AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC AAAGTAAACT 1320 

GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT GATCAAGAGA 1380 

CAGGATGAGG ATCGTTTCGC ATGATTGAAC AAGATGGATT GCACGCAGGT TCTCCGGCCG 14 4 0 

CTTGGGTGGA GAGGCTATTC GGCTATGACT GGGCACAACA GACAATCGGC TGCTCTGATG 1500 

CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC GCCCGGTTCT TTTTGTCAAG ACCGACCTGT 1560 

CCGGTGCCCT GAATGAACTG CAGGACGAGG CAGCGCGGCT ATCGTGGCTG GCCACGACGG 1620 

GCGTTCCTTG CGCAGCTGTG CTCGACGTTG TCACTGAAGC GGGAAGGGAC TGGCTGCTAT 1680 

TGGGCGAAGT GCCGGGGCAG GATCTCCTGT CATCTCACCT TGCTCCTGCC GAGAAAGTAT 1740 

CCATCATGGC TGATGCAATG CGGCGGCTGC ATACGCTTGA TCCGGCTACC TGCCCATTCG 1800 

ACCACCAAGC GAAACATCGC ATCGAGCGAG CACGTACTCG GATGGAAGCC GGTCTTGTCG 1860 

ATCAGGATGA TCTGGACGAA GAGCATCAGG GGCTCGCGCC AGCCGAACTG TTCGCCAGGC 1920 

TCAAGGCGCG CATGCCCGAC GGCGAGGATC TCGTCGTGAC CCATGGCGAT GCCTGCTTGC 1980 

CGAATATCAT GGTGGAAAAT GGCCGCTTTT CTGGATTCAT CGACTGTGGC CGGCTGGGTG 2040 

TGGCGGACCG CTATCAGGAC ATAGCGTTGG CTACCCGTGA TATTGCTGAA GAGCTTGGCG 2100 

GCGAATGGGC TGACCGCTTC CTCGTGCTTT ACGGTATCGC CGCTCCCGAT TCGCAGCGCA 2160 
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TCGCCTTCTA TCGCCTTCTT GACGAGTTCT 

CGACCAAGCG ACGCCCGCCA TGCCAAGCCT. 

AACTTGGCGA TGCGCGCACC CTACGGAGAA 

TCAACGGAGT GTTAGAACCG TTGGTAGTGG 

GGGCCCGTTT CTTGAGTATT CATTGGATAG 

TGATGAGCAC CCTGGAAGGC GCGCTGTACG 

GACGGAACTC CGTTCCCCAG TACCGCGATG 

ACGCCGCCTG ACGCTAAGCG GGGGCGGGGG 

TGAGTAGGCT CTTGGATGCC GCGGCGGCTG 

CGATGGATTC GATTGCCCGT GCTGCCGGCG 
CGAGCAAGGA AG AACTCAT T TCCCGGTTAG 
TC 



TCTGAGCGGG ACTCTGGGGT TCGAAATGAC 2220 

GTTCTCGTGC AAAGTCCTGT GGGTGAGTCG 2280 

GCGATCCACG GACTGCTCTC TGTCCTCCTT 234 0 

TTTTGGACGG GCCCAGGAGC ATGCGCTTCT 24 00 

TCACGCGTGG TAGCTTCGAG CCTGCACAGC 24 60 

CGGACGACTG GGTTCATCTT CGCCATTCAT 2520 

ACTATTTTGC CTCTTCCGAT GTCCGATTCC 2580 

CGCCCGCATC CCAGCCCAGA CAGCAACAAA 2640 

AGATTGGTAA CGGCAATTTC GTCAATGTGA 2700 

TCTCAAAAAA AACGCTGTAC GTCTTGGTGG 2760 

TGGCTCGAGA CATGTCCAAC CTTGAGGAAT 2820 

2822 
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Sequenz 5 



GAATTCCGCG 

GGTAGGGTCT 

TGCGTTTGCC 

TTAACTCGCG 

GTCTCGCCCT 

CGATTAAGAT 

CTCCAGCTCA 

AGAATAACAA 

CGGTCGGAGC 

AGGGGCCTGC 

TGGAAAATCG 

AGCAAACACT 

ACGTGGCCAA 

GCGTTGAGTT 

TACTGGCCTT 

CGTCCGAGCT 

ATGAAACTGA 

AGCCTTTCGA 

CCGCGGCGGA 

TTTCCCGCAG 

ATGCCGGGCA 

GGGCGCATGC 

CAAACGGCAT 

TATTTGCCCA 

CCTGTTCGGT 

CCTTGACCGA 

GTTTTTTTGT 

GATGTTTGAT 

GGCAGTCGCC 

CTCGGCCCTG 

GGAGACGTAG 

CGTAGTAAGA 

GCGGCTTACG 

GCAGTCTCCG 

CATGAGGCCA 

CCCGCAGTGG 



TATCGCCCGG 

TTTTCTTGGC 

GCTTCGCTTC 

TAAGCATTCT 

TTGAGGCCGA 

AATTAAAATA 

AGGGCAATTT 

TTGACTCCTC 

TGAGCAGCTG 

AAACTTGGAG 

TGAAGCAATT 

GCTTTGCGAC 

ATGGATGGAG 

TCAGCCGCTG 

TGGGCCGCTG 

TACCCCGCGG 

GCTGACTACA 

TCATCTGATC 

TAACCTAGTG 

TGCAGATATG 

AATCTGTCTG 

ATAAAAACTG 

GATGAACCTG 

TGGACGCACA 

TCGTAAACTG 

ACGCAGCGGT 

ACAGTCTATG 

GTTATGGAGC 

CTAAAACAAA 

ACCAAGTCAA 

CCACCTACTC 

CATTCATCGC 

TTCTGCCCAG 

GCGAGCACCG 

ACGCGCTTGG 

CTCTCTATAC 



TTCTATCAGC 
CATGCTTGTT 
GCGATGAACC 
GTCATTTTTT 
TTCTTGGGCG 
AGGAAACCGC 
TTGGGCTATT 
AGGAGGTCAG 
GGCTCGGCTC 
CTGCGTCTGA 
GCCGACGCGG 
ATTGCTGGCT 
CCCGAACATC 
GGTGTCGTTG 
GCCGGCATAT 
ACTTCTGCCC 
GTGCTGGGCG 
TTCACCGGCG 
CCCGTTACCC 
GCGGACGTTG 
GCACCGGACT 
TTGTAATTCA 
AATCGCCAGC 
CCGTGGAAAC 
TAATGCAAGT 
GGTAACGGCG 
CCTCGGGCAT 
AGCAACGATG 
GTTAGGTGGC 
ATCCATGCGG 
CCAACATCAG 
GCTTGCTGCC 
GTTTGAGCAG 
GAGGCAGGGC 
TGCTTATGTG 
AAAGTTGGGC 



GGGCCGCTTT 

GCCTGAACCT 

GCATCGAGAT 

TGGTGGCTTT 

CTTGGCGGCG 

ATGGTTTCTT 

GGCTGAGCAG 

CGATGAGCAT 

TTGATCGCAT 

GTAGGCTGGA 

TTTCTGCTGA 

CGGTGGCAAG 

ACAAGGCGAT 

GGGTCATTAG 

TCGCAGCAGG 

TGCTTGCGGA 

ACGCTGAAGT 

GCACTGCCGT 

TGGAATTGGG 

CACAACGGGT 

ATGTGCTGGG 

TTAAGCATTC 

GGCATCAGCA 

GGATGAAGGC 

AGCGTATGCG 

CAGTGGCGGT 

CCAAGCAGCA 

TTACGCAGCA 

TCAAGTATGG 

GCTGCTCTTG 

CCGGACTCCG 

TTCGACCAAG 

CCGCGTAGTG 

ATTGCCACCG 

ATCTACGTGC 

ATACGGGAAG 



CGAAAGTCAT 


GGTGTTAGCC 


60 


TCGTTGACAT 


AGGGCAGAGG 


120 


GCTGAGGTCA 


GGATTTTTCC 


180 


GAACAGCCTG 


ATGAAAGGTG 


240 


TCGAAGCGAT 


GCTCCACTAC 


300 


ATGTGAATTT 


GTCTGGCATA 


360 


TTGCCTCTAT 


ATGGTTATTC 


4 20 


TCTTGGTTTG 


AATGGTGCCC 


480 


GAAGAAGGCG 


CACCTGGAGC 


540 


TCGTGCGATT 


GCAATGCTTC 


600 


CTTTGGCAAT 


CGCAGCCGTG 


660 


CCTGAAGGAT 


AGCCGCGAGC 


720 


GTTTCCAGGG 


GCGGAGGCAC 


780 


TCCCTGGAAC 


TTCCCTATCG 


840 


TAATCGCGCC 


ATGCTCAAGC 


900 


GCTAATTGCT 


CGTTACTTCG 


960 


CGGTGCGCTG 


TTCAGTGCTC 


1020 


GGCCAAGCAC 


ATCATGCGTG 


1080 


TGGCAAATCG 


CCGGTGATCG 


1140 


GTTGACGGTG 


AAAACCTTCA 


1200 


GGAGAGGCGG 


TTTGCGTATT 


1260 


TGCCGACATG 


GAAGCCATCA 


1320 


CCTTGTCGCC 


TTGCGTATAA 


1380 


ACGAACCCAG 


TTGACATAAG 


1440 


CTCACGCAAC 


TGGTCCAGAA 


1500 


TTTCATGGCT 


TGTTATGACT 


1560 


AGCGCGTTAC 


GCCGTGGGTC 


1620 


GCAACGATGT 


TACGCAGCAG 


1680 


GCATCATTCG 


CACATGTAGG 


1740 


ATCTTTTCGG 


TCGTGAGTTC 


1800 


ATTACCTCGG 


GAACTTGCTC 


1860 


AAGCGGTTGT 


TGGCGCTCTC 


1920 


AGAT CT AT AT 


CTATGATCTC 


1980 


CGCTCATCAA 


TCTCCTCAAG 


2040 


AAGCAGATTA 


CGGTGACGAT 


2100 


AAGTGATGCA 


CTTTGATATC 


2160 
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GACCCAAGTA 
TGTGGGTGAG 
CTCTGTCCTC 
AGCATGCGCT 
GAGCCTGCAC 
CTTCGCCATT 
GATGTCCGAT 
AGACAGCAAC 
TTCGTCAATG 
TACGTCTTGG 
AACCTTGAGG 



CCGCCACCTA 
TCGAACTTGG 
CTTTCAACGG 
TCTGGGCCCG 
AGCTGATGAG 
CATGACGGAA 
TCCACGCCGC 
AAATGAGTAG 
TGACGATGGA 
TGGCGAGCAA 
AATTC 



ACAATTCGTT 
CGATGCGCGC 
AGTGTTAGAA 
TTTCTTGAGT 
CACCCTGGAA 
CTCCGTTCCC 
CTGACGCTAA 
GCTCTTGGAT 
TTCGATTGCC 
GGAAGAACTC 



CAAGCCGAGA 
ACCCTACGGA 
CCGTTGGTAG 
ATTCATTGGA 
GGCGCGCTGT 
CAGTACCGCG 
GCGGGGGCGG 
GCCGCGGCGG 
CGTGCTGCCG 
ATTTCCCGGT 



TCGGCTTCCC 
GAAGCGATCC 
TGGTTTTGGA 
TAGTCACGCG 
ACGCGGACGA 
ATGACTATTT 
GGGCGCCCGC 
CTGAGATTGG 
GCGTCTCAAA 
TAGTGGCTCG 



TGCAAAGTCC 
ACGGACTGCT 
CGGGCCCAGG 
TGGTAGCTTC 
CTGGGTTCAT 
TGCCTCTTCC 
ATCCCAGCCC 
TAACGGCAAT 
AAAAACGCTG 
AGACATGTCC 



2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
270.0 
2760 
2775 



WO 00/26355 



59 



PCT/EP99/07952 



Seguenz 6 

GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGT TGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGGTGCCC 4 80 

CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC 54 0 

AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 

TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 

AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 

ACGTGGCCAA ATGGATGGAG CCCGAACATC ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC 780 

GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG 84 0 

TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 

CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 

ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 

AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 

CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG 1140 

TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 

ATGCCGGGCA AATCTGTCTG GCACCGTGGG TGAGTCGAAC TTGGCGATGC GCGCACCCTA 1260 

CGGAGAAGCG ATCCACGGAC TGCTCTCTGT CCTCCTTTCA ACGGAGTGTT AG AACCGT TG 1320 

GTAGTGGTTT TGGACGGGCC CAGGAGCATG CGCTTCTGGG CCCGTTTCTT GAGTATTCAT 1380 

TGGATAGTCA CGCGTGGTAG CTTCGAGCCT GCACAGCTGA TGAGCACCCT GGAAGGCGCG 14 4 0 

CTGTACGCGG ACGACTGGGT TCATCTTCGC CATTCATGAC GGAACTCCGT TCCCCAGTAC 1500 

CGCGATGACT ATTTTGCCTC TTCCGATGTC CGATTCCACG CCGCCTGACG CTAAGCGGGG 1560 

GCGGGGGCGC CCGCATCCCA GCCCAGACAG CAACAAATGA GTAGGCTCTT GGATGCCGCG 1620 

GCGGCTGAGA TTGGTAACGG CAATTTCGTC AATGTGACGA TGGATTCGAT TGCCCGTGCT 1680 

GCCGGCGTCT CAAAAAAAAC GCTGTACGTC TTGGTGGCGA GCAAGGAAGA ACTCATTTCC 174 0 

CGGTTAGTGG CTCGAGACAT GTCCAACCTT GAGGAATTC 1779 
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Sequenz 7 

CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 2 40 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 

TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 4 20 

AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 4 80 

AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 54 0 

AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 

CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 

ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 

ATGCAGCACC TTTCCAGGGG ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG 7 80 

GTAAGGTTGG GAAGCCCTGC AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT 84 0 

GGCGCAGGGG ATCAAGATCT GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATGATTGAAC 900 

AAGATGGATT GCACGCAGGT TCTCCGGCCG CTTGGGTGGA GAGGCTATTC GGCTATGACT 960 

GGGCACAACA GACAATCGGC TGCTCTGATG CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC 1020 

GCCCGGTTCT TTTTGTCAAG ACCGACCTGT CCGGTGCCCT GAATGAACTG CAGGACGAGG 1080 

CAGCGCGGCT ATCGTGGCTG GCCACGACGG GCGTTCCTTG CGCAGCTGTG CTCGACGTTG 114 0 

TCACTGAAGC GGGAAGGGAC TGGCTGCTAT TGGGCGAAGT GCCGGGGCAG GATCTCCTGT 1200 

CATCTCACCT TGCTCCTGCC GAGAAAGTAT CCATCATGGC TGATGCAATG CGGCGGCTGC 1260 

ATACGCTTGA TCCGGCTACC TGCCCATTCG ACCACCAAGC GAAACATCGC ATCGAGCGAG 1320 

CACGTACTCG GATGGAAGCC GGTCTTGTCG ATCAGGATGA TCTGGACGAA GAGCATCAGG 1380 

GGCTCGCGCC AGCCGAACTG TTCGCCAGGC TCAAGGCGCG CATGCCCGAC GGCGAGGATC 14 4 0 

TCGTCGTGAC CCATGGCGAT GCCTGCTTGC CGAATATCAT GGTGGAAAAT GGCCGCTTTT 1500 

CTGGATTCAT CGACTGTGGC CGGCTGGGTG TGGCGGACCG CTATCAGGAC ATAGCGTTGG 1560 

CTACCCGTGA TATTGCTGAA GAGCTTGGCG GCGAATGGGC TGACCGCTTC CTCGTGCTTT 1620 

ACGGTATCGC CGCTCCCGAT TCGCAGCGCA TCGCCTTCTA TCGCCTTCTT GACGAGTTCT 1680 

TCTGAGCGGG ACTCTGGGGT TCGAAATGAC CGACCAAGCG ACGCCCCTGT TTTGCAATGG 17 4 0 

CGGTCGGCGA AAGTTGATGC GCTGTATCGT GGTGAAGATC AATCCATGCT GCGTGACGAG 1800 

GCCACACTGT GAGTTGGTCA GGGGGGGCTT ACTCGGCGTT TTCCGACACT GCGTTGGTTG 1860 

CGGCAGTGCG CACCCCCTGG ATTGATTGCG GGGGTGCCCT GTCGCTGGTG TCGCCTATCG 1920 

ACTTAGGGGT AAAGGTCGCT CGCGAAGTTC TGATGCGTGC GTCGCTTGAA CCACAAATGG 1980 

TCGATAGCGT ACTCGCAGGC TCTATGGCTC AAGCAAGCTT TGATGCTTAC CTGCTCCCGC 204 0 

GGCACATTGG CTTGTACAGC GGTGTTCCCA AGTCGGTTCC GGCCTTGGGG GTGCAGCGCA 2100 

TTTGCGGCAC AGGCTTCGAA CTGCTTCGGC AGGCCGGCGA GCAGATTTCC CAAGGCGCTG 2160 

ATCACGTGCT GTGTGTCGCG GGCTGCAG 2188 
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Sequenz 8 

CTGCAGCCGA GCATCGATTG AGC ACT T T AC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 

TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 4 20 

AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 4 80 

AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 54 0 

AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 

CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 

ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 

ATGCAGCACC TTTCCAGGGG GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT 7 80 

TGTAATTCAT TAAGCATTCT GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA 840 

ATCGCCAGCG GCATCAGCAC CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC 900 

CGTGGAAACG GATGAAGGCA CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT 960 

AATGCAAGTA GCGTATGCGC TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG 1020 

GTAACGGCGC AGTGGCGGTT TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC 1080 

CTCGGGCATC CAAGCAGCAA GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA 114 0 

GCAACGATGT TACGCAGCAG CAACGATGTT ACGCAGCAGG GCAGTCGCCC TAAAACAAAG 1200 

TTAGGTGGCT CAAGTATGGG CATCATTCGC ACATGTAGGC TCGGCCCTGA CCAAGTCAAA 1260 

TCCATGCGGG CTGCTCTTGA TCTTTTCGGT CGTGAGTTCG GAGACGTAGC CACCTACTCC 1320 

CAACATCAGC CGGACTCCGA TTACCTCGGG AACTTGCTCC GTAGTAAGAC ATTCATCGCG 1380 

CTTGCTGCCT TCGACCAAGA AGCGGTTGTT GGCGCTCTCG CGGCTTACGT TCTGCCCAGG 14 4 0 

TTTGAGCAGC CGCGTAGTGA GATCTATATC TATGATCTCG CAGTCTCCGG CGAGCACCGG 1500 

AGGCAGGGCA TTGCCACCGC GCTCATCAAT CTCCTCAAGC ATGAGGCCAA CGCGCTTGGT 1560 

GCTTATGTGA TCTACGTGCA AG C AG ATT AC GGTGACGATC CCGCAGTGGC TCTCTATACA 1620 

AAGTTGGGCA TACGGGAAGA AGTGATGCAC TTTGATATCG ACCCAAGTAC CGCCACCTAA 1680 

CAATTCGTTC AAGCCGAGAT CGGCTTCCCC TGTTTTGCAA TGGCGGTCGG CGAAAGTTGA 17 4 0 

TGCGCTGTAT CGTGGTGAAG ATCAATCCAT GCTGCGTGAC GAGGCCACAC TGTGAGTTGG 1800 

TCAGGGGGGG CTTACTCGGC GTTTTCCGAC ACTGCGTTGG TTGCGGCAGT GCGCACCCCC 18 60 

TGGATTGATT GCGGGGGTGC CCTGTCGCTG GTGTCGCCTA TCGACTTAGG GGTAAAGGTC 1920 

GCTCGCGAAG TTCTGATGCG TGCGTCGCTT GAACCACAAA TGGTCGATAG CGTACTCGCA 1980 

GGCTCTATGG CTCAAGCAAG CTTTGATGCT TACCTGCTCC CGCGGCACAT TGGCTTGTAC 204 0 

AGCGGTGTTC CCAAGTCGGT TCCGGCCTTG GGGGTGCAGC GCATTTGCGG CACAGGCTTC 2100 

GAACTGCTTC GGChGGCCGG CGAGCAGATT TCCCAAGGCG CTGATCACGT GCTGTGTGTC 2160 

GCGGGCTGCA G 2171 
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Sequenz 9 

CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 

TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 4 20 

AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 4 80 

AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 54 0 

AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 

CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 

ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 

ATGCAGCACC TTTCCAGCGC GCTGTTTTGC AATGGCGGTC GGCGAAAGTT GATGCGCTGT 780 

ATCGTGGTGA AGATCAATCC ATGCTGCGTG ACGAGGCCAC ACTGTGAGTT GGTCAGGGGG 84 0 

GGCTTACTCG GCGTTTTCCG ACACTGCGTT GGTTGCGGCA GTGCGCACCC CCTGGATTGA 900 

TTGCGGGGGT GCCCTGTCGC TGGTGTCGCC TATCGACTTA GGGGTAAAGG TCGCTCGCGA 960 

AGTTCTGATG CGTGCGTCGC TTGAACCACA AATGGTCGAT AGCGTACTCG CAGGCTCTAT 1020 

GGCTCAAGCA AGCTTTGATG CTTACCTGCT CCCGCGGCAC ATTGGCTTGT ACAGCGGTGT 1080 

TCCCAAGTCG GTTCCGGCCT TGGGGGTGCA GCGCATTTGC GGCACAGGCT TCGAACTGCT 114 0 

TCGGCAGGCC GGCGAGCAGA TTTCCCAAGG CGCTGATCAC GTGCTGTGTG TCGCGGGCTG 1200 

CAG 1203 
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Seguenz 10 



GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGT^GCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 20 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 4 80 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGGGGACAG CAAGCGAACC 54 0 

GGAATTGCCA GCTGGGGCGC CCTCTGGTAA GGTTGGGAAG CCCTGCAAAG TAAACTGGAT 600 

GGCTTTCTTG CCGCCAAGGA TCTGATGGCG CAGGGGATCA AGATCTGATC AAGAGACAGG 660 

ATGAGGATCG TTTCGCATGA TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG 720 

GGTGGAGAGG CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC 780 

CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 84 0 

TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG TGGCTGGCCA CGACGGGCGT 900 

TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA AGGGACTGGC TGCTATTGGG 960 

CGAAGTGCCG GGGCAGGATC TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT 1020 

CATGGCTGAT GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA 1080 

CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC TTGTCGATCA 114 0 

GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC GAACTGTTCG CCAGGCTCAA 1200 

GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT GGCGATGCCT GCTTGCCGAA 1260 

TATCATGGTG GAAAATGGCC GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC 1320 

GGACCGCTAT CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA 1380 

ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC AGCGCATCGC 14 40 

CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC TGGGGTTCGA AATGACCGAC 1500 

CAAGCGACGC CCCGAGCAGG GCATGAAGCA GTTCCTTGAC GAGAAAAGCA TCAAGCCGGG 1560 

CTTGCAGACC TACAAGCGCT GATAAATGCG CCGGGGCCCT CGCTGCGCCC CCGGCCTTCC 1620 

AATAATGACA ATAATGAGGA GTGCCCAATG TTTCACGTGC CCCTGCTTAT TGGTGGTAAG 1680 

CCTTGTTCAG CATCTGATGA GCGCACCTTC GAGCGTCGTA GCCCGCTGAC CGGAGAAGTG 17 4 0 

GTATCGCGCG TCGCTGCTGC CAGTTTGGAA GATGCGGACG CCGCAGTGGC CGCTGCACAG 1800 

GCTGCGTTTC CTGAATGGGC GGCGCTTGCT CCGAGCGAAC GCCGTGCCCG ACTGCTGCGA 1860 

GCGGCGGATC TTCTAGAGGA CCGTTCTTCC GAGTTCACCG CCGCAGCGAG TGAAACTGGC 1920 

GCAGCGGGAA ACTGGTATGG GTTTAACGTT TACCTGGCGG CGGGCATGTT GCGGGGAATT 1980 

C 1981 
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Sequenz 11 

GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

AT CG AG AG AT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 2.0 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 4 80 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGGGGGAGA GGCGGTTTGC 54 0 

GTATTGGGCG CAT GC AT AAA AACTGTTGTA ATTCATTAAG CATTCTGCCG ACATGGAAGC 600 

CATCACAAAC GGCATGATGA ACCTGAATCG CCAGCGGCAT CAGCACCTTG TCGCCTTGCG 660 

TATAATATTT GCCCATGGAC GCACACCGTG GAAACGGATG AAGGCACGAA CCCAGTTGAC 720 

ATAAGCCTGT TCGGTTCGTA AACTGTAATG CAAGTAGCGT ATGCGCTCAC GCAACTGGTC 780 

CAGAACCTTG ACCGAACGCA GCGGTGGTAA CGGCGCAGTG GCGGTTTTCA TGGCTTGTTA 84 0 

TGACTGTTTT TTTGTACAGT CTATGCCTCG GGCATCCAAG CAGCAAGCGC GTTACGCCGT 900 

GGGTCGATGT TTGATGTTAT GG AGCAGCAA CGATGTTACG CAGCAGCAAC GATGTTACGC 960 

AGCAGGGCAG TCGCCCTAAA ACAAAGTTAG GTGGCTCAAG TATGGGCATC ATTCGCACAT 1020 

GTAGGCTCGG CCCTGACCAA GTCAAATCCA TGCGGGCTGC TCTTGATCTT TTCGGTCGTG 1080 

AGTTCGGAGA CGTAGCCACC TACTCCCAAC ATCAGCCGGA CTCCGATTAC CTCGGGAACT 114 0 

TGCTCCGTAG TAAGACATTC ATCGCGCTTG CTGCCTTCGA CCAAGAAGCG GTTGTTGGCG 1200 

CTCTCGCGGC TTACGTTCTG CCCAGGTTTG AGCAGCCGCG TAGTGAGATC TATATCTATG 12 60 

ATCTCGCAGT CTCCGGCGAG CACCGGAGGC AGGGCATTGC CACCGCGCTC ATCAATCTCC 1320 

TCAAGCATGA GGCCAACGCG CTTGGTGCTT ATGTGATCTA CGTGCAAGCA GATTACGGTG 1380 

ACGATCCCGC AGTGGCTCTC T AT AC AAAG T TGGGCATACG GGAAGAAGTG ATGCACTTTG 14 4 0 

ATATCGACCC AAGTACCGCC ACCTAACAAT TCGTTCAAGC CGAGATCGGC TTCCCCGAGC 1500 

AGGGCATGAA GCAGTTCCTT GACGAGAAAA GCATCAAGCC GGGCTTGCAG ACCTACAAGC 1560 

GCTGATAAAT GCGCCGGGGC CCTCGCTGCG CCCCCGGCCT TCCAATAATG ACAATAATGA 1620 

GGAGTGCCCA ATGTTTCACG TGCCCCTGCT TATTGGTGGT AAGCCTTGTT CAGCATCTGA 1680 

TGAGCGCACC TTCGAGCGTC GTAGCCCGCT GACCGGAGAA GTGGTATCGC GCGTCGCTGC 17 4 0 

TGCCAGTTTG GAAGATGCGG ACGCCGCAGT GGCCGCTGCA CAGGCTGCGT TTCCTGAATG 1800 

GGCGGCGCTT GCTCCGAGCG AACGCCGTGC CCGACTGCTG CGAGCGGCGG ATCTTCTAGA 1860 

GGACCGTTCT TCCGAGTTCA CCGCCGCAGC GAGTGAAACT GGCGCAGCGG GAAACTGGTA 1920 

TGGGTTTAAC GTTTACCTGG CGGCGGGCAT GTTGCGGGGA ATTC 1964 



WO 00/26355 



65 



PCT/EP99/07952 



Sequenz 12 

GAATTCCCCT GGCGACG AAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 20 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 4 80 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGCGAGCAG GGCATGAAGC 54 0 

AGTTCCTTGA CGAGAAAAGC ATCAAGCCGG GCTTGCAGAC C T AC AAGCGC TGATAAATGC 600 

GCCGGGGCCC TCGCTGCGCC CCCGGCCTTC CAATAATGAC AATAATGAGG AGTGCCCAAT 660 

GTTTCACGTG CCCCTGCTTA TTGGTGGTAA GCCTTGTTCA GCATCTGATG AGCGCACCTT 720 

CGAGCGTCGT AGCCCGCTGA CCGGAGAAGT GGTATCGCGC GTCGCTGCTG CCAGTTTGGA 780 

AGATGCGGAC GCCGCAGTGG CCGCTGCACA GGCTGCGTTT CCTGAATGGG CGGCGCTTGC 84 0 

TCCGAGCGAA CGCCGTGCCC GACTGCTGCG AGCGGCGGAT CTTCTAGAGG ACCGTTCTTC 900 

CGAGTTCACC GCCGCAGCGA GTGAAACTGG CGCAGCGGGA AACTGGTATG GGTTTAACGT 960 

TTACCTGGCG GCGGGCATGT TGCGGGGAAT TC 992 
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Sequenz 13 

GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 24 0 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 4 20 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 4 80 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 54 0 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 

GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 780 

GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 84 0 

CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 

TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 

TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GGGGACAGCA AGCGAACCGG 1080 

AATTGCCAGC TGGGGCGCCC TCTGGTAAGG TTGGGAAGCC CTGCAAAGTA AACTGGATGG 114 0 

CTTTCTTGCC GCCAAGGATC TGATGGCGCA GGGGATCAAG ATCTGATCAA GAGACAGGAT 1200 

GAGGATCGTT TCGCATGATT GAACAAGATG GATTGCACGC AGGTTCTCCG GCCGCTTGGG 1260 

TGGAGAGGCT ATTCGGCTAT GACTGGGCAC AACAGACAAT CGGCTGCTCT GATGCCGCCG 1320 

TGTTCCGGCT GTCAGCGCAG GGGCGCCCGG TTCTTTTTGT CAAGACCGAC CTGTCCGGTG 1380 

CCCTGAATGA ACTGCAGGAC GAGGCAGCGC GGCTATCGTG GCTGGCCACG ACGGGCGTTC 14 4 0 

CTTGCGCAGC TGTGCTCGAC GTTGTCACTG AAGCGGGAAG GGACTGGCTG CTATTGGGCG 1500 

AAGTGCCGGG GCAGGATCTC CTGTCATCTC ACCTTGCTCC TGCCGAGAAA GTATCCATCA 1560 

TGGCTGATGC AATGCGGCGG CTGCATACGC TTGATCCGGC TACCTGCCCA TTCGACCACC 1620 

AAGCGAAACA TCGCATCGAG CGAGCACGTA CTCGGATGGA AGCCGGTCTT GTCGATCAGG 1680 

ATGATCTGGA CGAAGAGCAT CAGGGGCTCG CGCCAGCCGA ACTGTTCGCC AGGCTCAAGG 17 4 0 

CGCGCATGCC CGACGGCGAG GATCTCGTCG TGACCCATGG CGATGCCTGC TTGCCGAATA 1800 

TCATGGTGGA AAATGGCCGC TTTTCTGGAT TCATCGACTG TGGCCGGCTG GGTGTGGCGG 18 60 

ACCGCTATCA GGACATAGCG TTGGCTACCC GTGATATTGC TGAAGAGCTT GGCGGCGAAT 1920 

GGGCTGACCG CTTCCTCGTG CTTTACGGTA TCGCCGCTCC CGATTCGCAG CGCATCGCCT 1980 

TCTATCGCCT TCTTGACGAG TTCTTCTGAG CGGGACTCTG GGGTTCGAAA TGACCGACCA 2040 

AGCGACGCCC GGCCCAGCGC GTCGATTCGG GCATTTGCCA TATCAATGGA CCGACTGTGC 2100 

ATGACGAGGC TCAGATGCCA TTCGGTGGGG TGAAGTCCAG CGGCTACGGC AGCTTCGGCA 2160 
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o/ 



GTCGAGCATC GATTGAGCAC TTTACCCAGC TGCGCTGGCT GACCATTCAG AATGGCCCGC 2220 

GGCACTATCC AATCTAAATC GATCTTCGGG CGCCGCGGGC ATCATGCCCG CGGCGCTCGC 2280 

CTCATTTCAA TCTCTAACTT GATAAAAACA GAGCTGTTCT CCGGTCTTGG TGGATCAAGG 234 0 

CCAGTCGCGG AGAGTCTCGA AGAGGAGAGT ACAGTGAACG CCGAGTCCAC ATTGCAACCG 24 00 

CAGGCATCAT CATGCTCTGC TCAGCCACGC TACCGCAGTG TGTCGATTGG TCATCCTCCG 24 60 

GTTGAGGTTA CGCAAGACGC TGGAGGTATT GTCCGGATGC GTTCTCTCGA GGCGCTTCTT 2520 

CCCTTCCCGG GTGGAATTC 2539 
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Sequenz 14 

GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 24 0 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 4 2.0 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 4 80 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 54 0 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 

GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 780 

GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 8 40 

CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 

TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 

TGCAGGTCAA CGCATCCAGG TGGGGAGAGG CGGTTTGCGT ATTGGGCGCA TGCATAAAAA 1080 

CTGTTGTAAT TCATTAAGCA TTCTGCCGAC ATGGAAGCCA TCACAAACGG CATGATGAAC 1140 

CTGAATCGCC AGCGGCATCA GCACCTTGTC GCCTTGCGTA TAATATTTGC CCATGGACGC 1200 

ACACCGTGGA AACGGATGAA GGCACGAACC CAGTTGACAT AAGCCTGTTC GGTTCGTAAA 1260 

CTGTAATGCA AGTAGCGTAT GCGCTCACGC AACTGGTCCA GAACCTTGAC CGAACGCAGC 1320 

GGTGGTAACG GCGCAGTGGC GGTTTTCATG GCTTGTTATG ACTGTTTTTT TGTACAGTCT 1380 

ATGCCTCGGG CATCCAAGCA GCAAGCGCGT TACGCCGTGG GTCGATGTTT GATGTTATGG 14 4 0 

AGCAGCAACG ATGTTACGCA GCAGCAACGA TGTTACGCAG CAGGGCAGTC GCCCTAAAAC 1500 

AAAGTTAGGT GGCTCAAGTA TGGGCATCAT TCGCACATGT AGGCTCGGCC CTGACCAAGT 1560 

CAAATCCATG CGGGCTGCTC TTGATCTTTT CGGTCGTGAG TTCGGAGACG TAGCCACCTA 1620 

CTCCCAACAT CAGCCGGACT CCGATTACCT CGGGAACTTG CTCCGTAGTA AGACATTCAT 1680 

CGCGCTTGCT GCCTTCGACC AAGAAGCGGT TGTTGGCGCT CTCGCGGCTT ACGTTCTGCC 17 4 0 

CAGGTTTGAG CAGCCGCGTA GTGAGATCTA TATCTATGAT CTCGCAGTCT CCGGCGAGCA 1800 

CCGGAGGCAG GGCATTGCCA CCGCGCTCAT CAATCTCCTC AAGCATGAGG CCAACGCGCT 18 60 

TGGTGCTTAT GTGATCTACG TGCAAGCAGA TTACGGTGAC GATCCCGCAG TGGCTCTCTA 1920 

TACAAAGTTG GGCATACGGG AAGAAGTGAT GCACTTTGAT ATCGACCCAA GTACCGCCAC 1980 

CTAACAATTC GTTCAAGCCG AGATCGGCTT CCCAATTGGC CCAGCGCGTC GATTCGGGCA 204 0 

TTTGCCATAT CAATGGACCG ACTGTGCATG ACGAGGCTCA GATGCCATTC GGTGGGGTGA 2100 

AGTCCAGCGG CTACGGCAGC TTCGGCAGTC GAGCATCGAT TGAGCACTTT ACCCAGCTGC 2160 
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GCTGGCTGAC CATTCAGAAT GGCCCGCGGC ACTATCCAAT CTAAATCGAT CTTCGGGCGC 2220 

CGCGGGCATC ATGCCCGCGG CGCTCGCCTC ATTTCAATCT CTAACTTGAT AAAAACAGAG 2280 

CTGTTCTCCG GTCTTGGTGG ATCAAGGCCA GTCGCGGAGA GTCTCGAAGA GGAGAGTACA 234 0 

GTGAACGCCG AGTCCACATT GCAACCGCAG GCATCATCAT GCTCTGCTCA GCCACGCTAC 2 4 00 

CGCAGTGTGT CGATTGGTCA TCCTCCGGTT GAGGTTACGC AAGACGCTGG AGGTATTGTC 24 60 

CGGATGCGTT CTCTCGAGGC GCTTCTTCCC TTCCCGGGTG GAATTC 2506 
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Sequenz 15 

GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG €0 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCG ACT 24 0 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCG AT G TC ATTCCGTCCA ATGTGCCCGG 4 20 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 4 80 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 54 0 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 

GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 780 

GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 84 0 

CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 

TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTGTTG GGTTCGTTGA TTGATGCCAA 1020 

TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GCAAAAGGCG CGCAATGGAA 1080 

TTGGCCCAGC GCGTCGATTC GGGCATTTGC CATATCAATG GACCGACTGT GCATGACGAG 114 0 

GCTCAGATGC CATTCGGTGG GGTGAAGTCC AGCGGCTACG GCAGCTTCGG CAGTCGAGCA 1200 

TCGATTGAGC ACTTTACCCA GCTGCGCTGG CTGACCATTC AGAATGGCCC GCGGCACTAT 1260 

CCAATCTAAA TCGATCTTCG GGCGCCGCGG GCATCATGCC CGCGGCGCTC GCCTCATTTC 1320 

AATCTCTAAC TTGATAAAAA CAGAGCTGTT CTCCGGTCTT GGTGGATCAA GGCCAGTCGC 1380 

GGAGAGTCTC GAAGAGGAGA GTACAGTGAA CGCCGAGTCC ACATTGCAAC CGCAGGCATC 1440 

ATCATGCTCT GCTCAGCCAC GCTACCGCAG TGTGTCGATT GGTCATCCTC CGGTTGAGGT 1500 

TACGCAAGAC GCTGGAGGTA TTGTCCGGAT GCGTTCTCTC GAGGCGCTTC TTCCCTTCCC 1560 

GGGTGGAATT C 1571 
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Seqfuenz 16 

GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 24 0 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATT TCCCA 42.0 

AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC 4 80 

GTATACACAC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 54 0 

GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGG 600 

GACAGCAAGC GAACCGGAAT TGCCAGCTGG GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG 660 

CAAAGTAAAC TGGATGGCTT TCTTGCCGCC AAGGATCTGA TGGCGCAGGG GATCAAGATC 720 

TGATCAAGAG ACAGGATGAG GATCGTTTCG CATGATTGAA CAAGATGGAT TGCACGCAGG 780 

TTCTCCGGCC GCTTGGGTGG AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG 84 0 

CTGCTCTGAT GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA 900 

GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC TATCGTGGCT 960 

GGCCACGACG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT GTCACTGAAG CGGGAAGGGA 1020 

CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA GGATCTCCTG TCATCTCACC TTGCTCCTGC 1080 

CGAGAAAGTA TCCATCATGG CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC 114 0 

CTGCCCATTC GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC 1200 

CGGTCTTGTC GAT C AG GAT G ATCTGGACGA AGAGCATCAG GGGCTCGCGC CAGCCGAACT 1260 

GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT CTCGTCGTGA CCCATGGCGA 1320 

TGCCTGCTTG CCGAATATCA TGGTGGAAAA TGGCCGCTTT TCTGGATTCA TCGACTGTGG 1380 

CCGGCTGGGT GTGGCGGACC GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA 14 4 0 

AGAGCTTGGC GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA 1500 

TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG GACTCTGGGG 1560 

TTCGAAATGA CCGACCAAGC GACGCCCATT GAGGGCGCAA GAGGAGAAAT GGATTGACCA 1620 

AGAGATCGTG GCTGTTACGG ATGAACAGTT CGATTTAGAG GGCTACAACA GTCGAGCAAT 1680 

TGAACTGCCT CGGAAGGCAA AATTGTTGAT CGTGACAGTC ATCCGCGGCC TAGCAGTCTT 17 4 0 

TGAAGCCCTT TCCCGATTGA AGCCTGTTCA TTCTGGCGGG GTGCAGACTG CGGGCAACAG 1800 

CTGTGCCGTA GTGGACGGCG CCGCGGCGGC TTTGGTGGCT CGAGAGTCGT CTGCGACACA 1860 

GCCGGTCTTG GCTAGGATAC TGGCTACCTC CGTAGTCGGG ATCGAGCCCG AGCATATGGG 1920 

GCTCGGCCCT GCGCCCGCGA TTCGCCTGCT GCTTGCGCGT AGTGATCTTA GTTTGAGGGA 1980 

TATCGACCTC TTTGAGATAA ACGAGGCGCA GGCCGCCCAA GTTCTAGCGG TACAGCATGA 2040 

ATTGGGTATT GAGCACTCAA AACTTAATAT TTGGGGCGGG GCCATTGCAC TTGGACACCC 2100 

GCTTGCCGCG ACCGGATTGC GTCTCTGCAT GACCCTCGCT CACCAATTGC AAGCTAATAA 2160 
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CTTTCGATAT GGAATTGCCT CGGCATGCAT TGGTGGGGGA CAGGGGATGG CGGTTCTTTT 2220 

AGAGAATCCC CACTTCGGTT CGTCCTCTGC ACGAAGTTCG ATGATTAACA GAGTTGACCA 2280 

CTATCCACTG AGCTAACGGG CATCTCCTTT GTTGCTTTGA GGTGGCGCAC GAAGGAGGGC 2 34 0 

TCGAAAATCT CTGCTAAAAA CAAGAAGAAG GAACAGGGAA CATGATTAGT TTCGCTCGTA 24 00 

TGGCAGAAAG TTTAGGAGTC CAGGCTAAAC TTGCCCTTGC CTTCGCACTC GTATTATGTG 24 60 

TCGGGCTGAT TGTTACCGGC ACGGGTTTCT ACAGTGTACA TACCTTGTCA GGGTTGGTGG 2520 

GAATTC 2526 
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Sequenz 17 

GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 24 0 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 4 20 

AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC 4 80 

G TAT AC AC AC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 54 0 

GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGG 600 

GGAGAGGCGG TTTGCGTATT GGGCGCATGC ATAAAAACTG TTGTAATTCA TTAAGCATTC 660 

TGCCGACATG GAAGCCATCA CAAACGGCAT GATGAACCTG AATCGCCAGC GGCATCAGCA 7 20 

CCTTGTCGCC TTGCGTATAA TATTTGCCCA TGGACGCACA CCGTGGAAAC GGATGAAGGC 780 

ACGAACCCAG TTGACATAAG CCTGTTCGGT TCGTAAACTG TAATGCAAGT AGCGTATGCG 84 0 

CTCACGCAAC TGGTCCAGAA CCTTGACCGA ACGCAGCGGT GGTAACGGCG CAGTGGCGGT 900 

TTTCATGGCT TGTTATGACT GTTTTTTTGT ACAGTCTATG CCTCGGGCAT CCAAGCAGCA 960 

AGCGCGTTAC GCCGTGGGTC GATGTTTGAT GTTATGGAGC AGCAACGATG TTACGCAGCA 1020 

GCAACGATGT TACGCAGCAG GGCPiGTCGCC CTAAAACAAA GTTAGGTGGC TCAAGTATGG 1080 

GCATCATTCG CACATGTAGG CTCGGCCCTG ACCAAGTCAA ATCCATGCGG GCTGCTCTTG 114 0 

ATCTTTTCGG TCGTGAGTTC GGAGACGTAG CCACCTACTC CCAACATCAG CCGGACTCCG 1200 

ATTACCTCGG GAACTTGCTC CGTAGTAAGA CATTCATCGC GCTTGCTGCC TTCGACCAAG 1260 

AAGCGGTTGT TGGCGCTCTC GCGGCTTACG TTCTGCCCAG GTTTGAGCAG CCGCGTAGTG 1320 

AGATCTATAT CTATGATCTC GCAGTCTCCG GCGAGCACCG GAGGCAGGGC ATTGCCACCG 1380 

CGCTCATCAA TCTCCTCAAG CATGAGGCCA ACGCGCTTGG TGCTTATGTG ATCTACGTGC 14 4 0 

AAGC AG AT T A CGGTGACGAT CCCGCAGTGG CTCTCTATAC AAAGTTGGGC ATACGGGAAG 1500 

AAGTGATGCA CTTTGATATC GACCCAAGTA CCGCCACCTA ACAATTCGTT CAAGCCGAGA 1560 

TCGGCTTCCC ATTGAGGGCG CAAGAGGAGA AATGGATTGA CCAAGAGATC GTGGCTGTTA 1620 

CGGATGAACA GTTCGATTTA GAGGGCTACA ACAGTCGAGC AATTGAACTG CCTCGGAAGG 1680 

CAAAATTGTT GATCGTGACA GTCATCCGCG GCCTAGCAGT CTTTGAAGCC CTTTCCCGAT 17 40 

TGAAGCCTGT TCATTCTGGC GGGGTGCAGA CTGCGGGCAA CAGCTGTGCC GTAGTGGACG 1800 

GCGCCGCGGC GGCTTTGGTG GCTCGAGAGT CGTCTGCGAC ACAGCCGGTC TTGGCTAGGA 18 60 

TACTGGCTAC CTCCGTAGTC GGGATCGAGC CCGAGCATAT GGGGCTCGGC CCTGCGCCCG 1920 

CGATTCGCCT GCTGCTTGCG CGTAGTGATC TTAGTTTGAG GGATATCGAC CTCTTTGAGA 1980 

TAAACGAGGC GCAGGCCGCC CAAGTTCTAG CGGTACAGCA TGAATTGGGT ATTGAGCACT 2040 

CAAAACTTAA TATTTGGGGC GGGGCCATTG CACTTGGACA CCCGCTTGCC GCGACCGGAT 2100 

TGCGTCTCTG CATGACCCTC GCTCACCAAT TGCAAGCTAA TAACTTTCGA TATGGAATTG 2160 



WO 00/26355 



74 



PCT/EP99/07952 



CCTCGGCATG CATTGGTGGG GGACAGGGGA TGGCGGTTCT TTTAGAGAAT CCCCACTTCG 2220 

GTTCGTCCTC TGCACGAAGT TCGATGATTA ACAGAGTTGA CCACTATCCA CTGAGCTAAC 2280 

GGGCATCTCC TTTGTTGCTT TGAGGTGGCG CACGAAGGAG GGCTCGAAAA TCTCTGCTAA 234 0 

AAACAAGAAG AAGGAACAGG GAACATGATT AGTTTCGCTC GTATGGCAGA AAGTTTAGGA 24 00 

GTCCAGGCTA AACTTGCCCT TGCCTTCGCA CTCGTATTAT GTGTCGGGCT GATTGTTACC 24 60 

GGCACGGGTT TCTACAGTGT ACATACCTTG TCAGGGTTGG TGGGAATTC 2509 
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Sequenz 18 

GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 2 40 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 4 20 

AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC 4 80 

GT AT AC AC AC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 54 0 

GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGC 600 

GCGCATTGAG GGCGCAAGAG GAGAAATGGA TTGACCAAGA GATCGTGGCT GTTACGGATG 660 

AACAGTTCGA TTTAGAGGGC TACAACAGTC GAGCAATTGA ACTGCCTCGG AAGGCAAAAT 7 20 

TGTTGATCGT GACAGTCATC CGCGGCCTAG CAGTCTTTGA AGCCCTTTCC CGATTGAAGC 7 80 

CTGTTCATTC TGGCGGGGTG CAGACTGCGG GCAACAGCTG TGCCGTAGTG GACGGCGCCG 84 0 

CGGCGGCTTT GGTGGCTCGA GAGTCGTCTG CGACACAGCC GGTCTTGGCT AGGATACTGG 900 

CTACCTCCGT AGTCGGGATC GAGCCCGAGC ATATGGGGCT CGGCCCTGCG CCCGCGATTC 960 

GCCTGCTGCT TGCGCGTAGT GATCTTAGTT TGAGGGATAT CGACCTCTTT GAGATAAACG 1020 

AGGCGCAGGC CGCCCAAGTT CTAGCGGTAC AGCATGAATT GGGTATTGAG CACTCAAAAC 1080 

TTAATATTTG GGGCGGGGCC ATTGCACTTG GACACCCGCT TGCCGCGACC GGATTGCGTC 114 0 

TCTGCATGAC CCTCGCTCAC CAATTGCAAG CTAATAACTT TCGATATGGA ATTGCCTCGG 1200 

CATGCATTGG TGGGGGACAG GGGATGGCGG TTCTTTTAGA GAATCCCCAC TTCGGTTCGT 1260 

CCTCTGCACG AAGTTCGATG ATTAACAGAG TTGACCACTA TCCACTGAGC TAACGGGCAT 1320 

CTCCTTTGTT GCTTTGAGGT GGCGCACGAA GGAGGGCTCG AAAATCTCTG CTAAAAACAA 1380 

GAAGAAGGAA CAGGGAACAT GATTAGTTTC GCTCGTATGG CAGAAAGTTT AGGAGTCCAG 14 4 0 

GCTAAACTTG CCCTTGCCTT CGCACTCGTA TTATGTGTCG GGCTGATTGT TACCGGCACG 1500 

GGTTTCTACA GTGTACATAC CTTGTCAGGG TTGGTGGGAA TTC 154 3 
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WO 00/26355 PCT/EP99/07952 

Konstruktion von Produktionsstammen fur die Herstellung von substituierten 
Phenolen durch gezielte Inaktivierungen von Genen des Eugenol- und Fcrula- 
saure-Katabolismus 

Die vorliegende Erfindung betrifft die Konstruktion von Produktionsstammen und 
ein Verfahren fur die Herstellung substituierter Methoxyphenole, insbesondere 
Vanillin. 

Die DE-A 4 227 076 (Verfahren zur Herstellung substituierter Methoxyphenole und 
dafur geeigneter Mikroorganismus) beschreibt die Herstellung substituierter 
Methoxyphenole mit einer neuen Pseudomonas sp.. Ausgangsmaterial ist hier Euge- 
nol und die Produkte sind Ferulasaure, Vanillinsaure, Coniferylalkohol und Coni- 
ferylaldehyd. 

Ebenfalls 1995 erscheint ein umfangreiches Review uber die Biotransformations- 
moglichkeiten mit Ferulasaure von Rosazza et al. (Biocatalytic transformation of 
ferulic acid: an abundant aromatic natural product; J. Ind. Microbiol. 15:457-471). 

Die Gene und Enzyme zur Synthese von Coniferylalkohol, Coniferylaldehyd, 
Ferulasaure, Vanillin und Vanillinsaure aus Pseudomonas sp. wurden in EP-A 
0 845 532 beschrieben. 

Die Enzyme zur Umsetzung von frans-Ferulasaure zu /rara-Feruloyl-SCoA Ester 
und weiter zum Vanillin, sowie das Gen fur die Spaltung des Esters wurden vom 
Institute of Food Research, Norwich, GB, in WO 97/35999 beschrieben. 1998 
erscheint der Inhalt des Patents auch als wissenschaftliche Publikationen (Gasson et 
al. 1998. Metabolism of ferulic acid to vanillin. J. Biol. Chem. 273:4163-4170; 
Narbad and Gasson 1998. Metabolism of ferulic acid via vanillin using a novel CoA- 
dependent pathway in a newly isolated strain of Pseudomonas fluorescens. Micro- 
biology 144:1397- 1405). 
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Die DE-A 195 32 317 beschreibt die fermentative Gewinnung von Vanillin aus 
Ferulasaure mit Amycolaiopsis sp. in hohen Ausbeuten. 

5 Die bekannten Verfahren haben den Nachteil, daB entweder nur sehr geringe Aus- 

beuten an Vanillin erzielt werden, oder von relativ teuren Edukten ausgegangen wird. 
Bei dem letztgenannten Verfahren (DE-A 195 32 317) werden zwar hohe Ausbeuten 
erzielt, jedoch bedingt der Einsatz von Pseudomonas sp. HR199 und Amycolaiopsis 
sp. HR167 fur die Biotransformation von Eugenol zu Vanillin eine zweistufige 
10 Fermentationsfuhrung und somit einen erheblichen Kosten- und Zeitaufwand. 

Aufgabe der vorliegenden Erfindung ist es daher, Organismen zu konstruieren, die in 
der Lage sind den preiswerten Rohstoff Eugenol in einem einstufigen ProzeB zu 
Vanillin umzusetzen. 

15 

Diese Aufgabe wird durch die Konstruktion von Produktionsstammen ein- oder 
mehrzelliger Organismen gelost, die dadurch gekennzeichnet sind, daB Enzyme des 
Eugenol- und/oder Ferulasaure-Katabolismus derart inaktiviert sind, daB eine Akku- 
mulation der Intermediate Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin 
20 und/oder Vanillinsaure erfolgt. 

Der Produktionsstamm kann einzellig oder mehrzellig sein. DemgemaB konnen 
Gegenstand der Erfindung Mikroorganismen, Pflanzen oder Tiere sein. Dariiber 
hinaus konnen auch Extrakte die aus dem Produktionsstamm gewonnen werden zum 

25 Einsatz kommen. ErfindungsgemaB werden vorzugsweise einzellige Organismen 

eingesetzt. Hierbei kann es sich um Mikroorganismen, tierische oder pflanzliche 
Zellen handeln. Besonders bevorzugt ist erfindungsgemaB der Einsatz von Pilzen und 
Bakterien. Hochst bevorzugt sind Bakterienarten. Unter den Bakterien konnen insbe- 
sondere Rhodococcus-, Pseudomonas- und Escherichia-Arten nach Veranderung des 

30 Eugenol- und/oder Ferulasaure-Katabolismus zum Einsatz kommen. 
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Die Gewinnung der erfindungsgemaB einsetzbaren Organismen kann im einfachsten 
Fall mittels bekannter, konventioneller mikrobiologischer Methoden erfolgen. So 
kann die Enzymaktivitat der am Eugenol- und/oder Ferulasaure-Katabolismus betei- 
ligten Proleine durch den Einsatz von Enzym-Hemmstoffen verandert werden. 
Daruber hinaus kann die Enzymaktivitat der am Eugenol- und/oder Ferulasaure- 
Katabolismus beteiligten Proteine durch Mutation der fur diese Proteine kodierenden 
Gene verandert werden. Derartige Mutationen konnen nach klassischen Methoden 
ungerichtet erzeugt werden, wie beispielsweise durch UV-Bestrahlung oder muta- 
tionsauslosende Chemikalien. 

Ebenso sind gentechnische Methoden zur Gewinnung der erfindungsgemaBen Orga- 
nismen geeignet, wie Deletionen, Insertionen und/oder Nukleotid-Austausche. So 
konnen beispielsweise die Gene der Organismen mit Hilfe von anderen DNA-Ele- 
menten (Q-Elemente) inaktiviert werden. Ebenso konnen mittels geeigneter Vektoren 
Austausche der intakten Gene gegen veranderte und/oder inaktivierte Gen-Strukturen 
durchgefiihrt werden. Die zu inaktivierenden Gene und die fur die Inaktivierung ein- 
gesetzten DNA-Elemente konnen dabei durch klassische Klonierungstechniken oder 
durch Polymerase-Kettenreaktionen (PCR) gewonnen werden. 

In einer moglichen Ausgestaltung der Erfindung kann beispielsweise der Eugenol- 
sowie der Ferulasaure-Katabolismus durch Q-EIement-Insertion oder Einfuhren von 
Deletionen in entsprechende Gene verandert werden. Hierbei konnen die Funktionen 
der Gene, die fur Dehydrogenases Synthetasen, Hydratasen-Aldolasen, Thiolasen 
oder Demethylasen kodieren, mittels der oben genannten gentechnischen Methoden 
inaktiviert werden, so dafi die Erzeugung der betreffenden Enzyme blockiert ist. Vor- 
zugsweise handelt es sich um die Gene, die fur Coniferylalkohol-Dehydrogenasen, 
Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA-Synthetasen, Enoyl-CoA- 
Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydrogenasen oder Vanillin- 
saure-Demethylasen kodieren. Ganz besonders bevorzugt sind Gene, die die in der 
EP-A 0845532 angegebenen Aminosauresequenzen kodieren und/oder deren Allel- 
variationen kodierenden Nukleotidsequenzen. 
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Gegenstand der Erfindung sind demgemaB auch Gen-Strukturen zur Herstellung 
transformierter Organismen und Mutanten. 

5 Vorzugsweise werden Gen-Strukturen zur Gewinnung der Organismen und Mutanten 
eingesetzt, bei denen die fur Dehydrogenase^ Synthetases Hydratasen-Aldolasen, 
Thiolasen oder Demethylasen kodierenden Nukleotidsequenzen inaktiviert sind. 
Besonders bevorzugt sind Gen-Strukturen, bei dene die fur Coniferylalkohol- 
Dehydrogenasen, Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA-Synthetasen, 

1 0 Enoyl-CoA-Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydrogenasen 
oder Vanillinsaure-Demethylasen kodierenden Nukleotidsequenzen inaktiviert sind. 
Ganz besonders bevorzugt sind Gen-Strukturen, die die in den Figuren la bis lr 
angegebenen Strukturen mit den in den Figuren 2a bis 2r wiedergegebenen 
Nukleotidsequenzen und/oder deren Allelvariationen kodierenden Nukleotidsequen- 

15 zen aufweisen. Besonders bevorzugt sind hierbei Nukleotidsequenzen von 1 bis 18. 

Die Erfindung schlieBt auch die Teilsequenzen dieser Gen-Strukturen sowie funktio- 
nelle Aquivalente ein. Unter funktionellen Aquivalenten sind solche Derivate der 
DNA zu verstehen, bei denen einzelne Nukleobasen ausgetauscht worden sind 
20 (Wobbelaustausche), ohne die Funktion zu andern. Auch auf Proteinebene konnen 
Aminosauren ausgetauscht werden, ohne daB eine Veranderung der Funktion die 
Folge ist. 

Den Gen-Strukturen konnen ein oder mehrere DNA-Sequenzen vor- und/oder nach- 
25 geschaltet sein. Durch Klonierung der Gen-Strukturen sind Plasmide bzw. Vektoren 

erhaltlich, die zur Transformation und/oder Transfektion eines Organismus und/oder 
zur konjugativen Ubertragung in einen Organismus geeignet sind. 

Gegenstand der Erfindung sind ferner Plasmide und/oder Vektoren zur Herstellung 
30 der erfindungsgemafien transformierten Organismen und Mutanten. Diese enthalten 
demgemaB die beschriebenen Gen-Strukturen. Die vorliegende Erfindung betrifft 
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demgemaB auch Organismen, die die genannten Plasmide und/oder Vektoren ent- 
halten. 

Die Art der Plasmide und/oder Vektoren hangt von deren Einsatzzweck ab. Urn z. B. 
5 die intakten Gene des Eugenol- und/oder Ferulasaure-Katabolismus in Pseudomona- 
den gegen die durch Omega-Elemente inaktivierten Gene austauschen zu k6nnen, 
benotigt man Vektoren, die einerseits in Pseudomonaden ubertragen werden konnen 
(konjugativ ubertragbare Plasmide), andererseits dort jedoch nicht repliziert werden 
konnen und somit in Pseudomonaden instabil sind (sogenannte Suizid-Plasmide), 
10 DNA-Abschnitte, die mit Hilfe eines solchen Plasmidsystems in Pseudomonaden 
ubertragen werden, konnen nur erhalten bleiben, wenn sie durch homologe Rekom- 
bination in das Genom der Bakterienzelle integriert werden. 

Die beschriebenen Gen-Strukturen, Vektoren und Plasmide konnen zur Herstellung 
1 5 verschiedener transformierter Organismen oder Mutanten verwendet werden. Mittels 
der gennanten Gen-Strukturen konnen intakte Nukleinsauresequenzen gegen veran- 
derte und/oder inaktivierte Gen-Strukturen ausgetauscht werden. In den durch Trans- 
formation oder Transfektion oder Konjugation erhaltlichen Zellen erfolgt durch 
homologe Rekombination ein Austausch des intakten Gens gegen die veranderte 
20 und/oder inaktivierte Gen-Struktur, wodurch die resultierenden Zellen nur noch uber 
die veranderte und/oder inaktivierte Gen-Struktur im Genom verfugen. So konnen 
erfindungsgemaB vorzugsweise Gene derart verandert und/oder inaktiviert werden, 
daB die betreffenden Organismen Coniferylalkohol, Coniferylaldehyd, Ferulasaure, 
Vanillin und/oder Vanillinsaure zu erzeugen vermogen. 

25 

ErfindungsgemaB derart konstruierte Produktionsstamme sind beispielsweise 
Mutanten des Stammes Pseudomonas sp. HR199 (DSM 7063) der in der DE-A 4 227 
076 und der EP-A 0845532 genau beschrieben wurde, wobei sich unter anderem die 
entsprechenden Genstrukturen aus den Figuren la bis lr in Verbindung mit den Figu- 
30 ren 2a bis 2r ergeben: 
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Pseudomonas sp. HR199ca/,4QKm, enthallend das durch QKm inaktivierte 
calA-Gzn an Stelle des intakten calA-Gens kodierend fur Coniferylalkohol- 
Dehydrogenase (Fig. la; Fig. 2a), 

Pseudomonas sp. HR199caA4QGm, enthaltend das durch QGm inaktivierte 
calA-Gen an Stelle des intakten calA-Gtns kodierend fur Coniferylalkohol- 
Dehydrogenase (Fig. lb; Fig. 2b). 

Pseudomonas sp. HR199caWA, enthaltend das durch Deletion inaktivierte 
calA-Gex\ an Stelle des intakten calA-Gens kodierend fur Coniferylalkohol- 
Dehydrogenase (Fig. lc; Fig. 2c). 

Pseudomonas sp. HR199ctf/Z?QKm, enthaltend das durch QKm inaktivierte 
calB-Gen an Stelle des intakten calB-Gens kodierend fur Coniferylaldehyd- 
Dehydrogenase (Fig. Id; Fig. 2d) 

Pseudomonas sp. HR199ca/£QGm, enthaltend das durch QGm inaktivierte 
calB-Gen an Stelle des intakten ca/5-Gens kodierend fur Coniferylaldehyd- 
Dehydrogenase (Fig. le; Fig. 2e). 

Pseudomonas sp. HR199c<a/5A, enthaltend das durch Deletion inaktivierte 
calB-Gen an Stelle des intakten calB-Gens kodierend fur Coniferylaldehyd- 
Dehydrogenase(Fig.lf; Fig. 2f). 

Pseudomonas sp. HR199/csQKm, enthaltend das durch QKm inaktivierte fcs- 
Gen an Stelle des intakten yes-Gens kodierend fur Ferulasaure-CoA-Synthe- 
tase(Fig.lg; Fig. 2g). 

Pseudomonas sp. HR199/asQGm 5 enthaltend das durch QGm inaktivierte fcs- 
Gen an Stelle des intakten yes-Gens kodierend fur Ferulasaure-CoA-Synthe- 
tase (Fig.lh; Fig. 2h). 

Pseudomonas sp. HR199/csA ? enthaltend das durch Deletion inaktivierte fes- 
Gen an Stelle des intakten yes-Gens kodierend fur Ferulasaure-CoA-Synthe- 
tase (Fig.li; Fig. 2i). 

Pseudomonas sp. HR199ec/zQKm, enthaltend das durch QKm inaktivierte 
ech-Gen an Stelle des intakten <?c/?-Gens kodierend fur Enoyl-CoA- 
Hydratase- Aldolase (Fig.lj; Fig. 2j). 
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11. Pseudomonas sp. HR199ec/*QGm, enthaltend das durch QGm inaktivierte 
ec/z-Gen an Stelle des intakten ec/2-Gens kodierend fur Enoyl-CoA-Hydra- 
tase- Aldolase (Fig. Ik; Fig. 2k). 

1 2. Pseudomonas sp. HR1 99echA, enthaltend das durch Deletion inaktivierte ech- 
Gen an Stelle des intakten ech-Gens kodierend fur Enoyl-CoA-Hydratase- 
Aldolase (Fi.il; Fig. 21). 

13. Pseudomonas sp. HR199aafQKm, enthaltend das durch QKm inaktivierte 
aa/-Gen an Stelle des intakten aat-Gens kodierend fur beta-Ketothiolase 
(Fig. lm; Fig. 2m). 

14. Pseudomonas sp. HR199a#/QGm, enthaltend das durch QGm inaktivierte 
aat-Gcn an Stelle des intakten aat-Gens kodierend fur beta-Ketothiolase 
(Fig. In; Fig. 2n). 

15. Pseudomonas sp. HR199aa/A, enthaltend das durch Deletion inaktivierte aat- 
Gen an Stelle des intakten a#/-Gens kodierend fur beta-Ketothiolase (Fig.lo; 
2o). 

16. Pseudomonas sp. HR199v<#zQKm, enthaltend das durch QKm inaktivierte 
vdh-Gen an Stelle des intakten vdh-Gcns kodierend fur Vanillin-Dehydroge- 
nase (Fig.lp; Fig. 2p). 

17. Pseudomonas sp. HR199v<i/zQGm 3 enthaltend das durch QGm inaktivierte 
vdh-Gen an Stelle des intakten vdh-Gens kodierend fur Vanillin-Dehydroge- 
nase (Fig.lq; Fig. 2q). 

18. Pseudomonas sp. HR199w#*A, enthaltend das durch Deletion inaktivierte 
vdh-Gcn an Stelle des intakten vdh-Gcns kodierend fur Vanillin-Dehydroge- 
nase (Fig.lr; Fig. 2r), 

19. Pseudomonas sp. HR199v^/z J BQKm, enthaltend das durch QKm inaktivierte 
vdhB-Gtn an Stelle des intakten vdhB-Gens kodierend fur Vanillin-Dehydro- 
genase II. 

20. Pseudomonas sp. HR199v<i/*Z?QGm, enthaltend das durch QGm inaktivierte 
vdhB-Gen an Stelle des intakten vdhB-Gzns kodierend fur Vanillin-Dehydro- 
genase IL 
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21. Pseudomonas sp. HR199v^/z5A, enthaltend das durch Deletion inaktivierte 
vdhB-Gcn an Stelle des intakten vdhB-Gens kodierend fur Vanillin-Dehydro- 
genase II. 

22. Pseudomonas sp, HR199tf^/?QKrn, enthaltend das durch QKm inaktivierte 
5 adh-Gen an Stelle des intakten adh-Gens kodierend ftir Alkohol-Dehydroge- 

nase. 

23. Pseudomonas sp. HR199a J/zQGm, enthaltend das durch QGm inaktivierte 
adh-Gen an Stelle des intakten adh-Gens kodierend fur Alkohol-Dehydroge- 
nase. 

10 24. Pseudomonas sp. HR199a<#zA enthaltend das durch Deletion inaktivierte adh- 

Gen an Stelle des intakten adh-Gens kodierend fur Alkohol-Dehydrogenase. 
25. Pseudomonas sp. HR199v<7/viQKm 5 enthaltend das durch QKm inaktivierte 
vanA-Gen an Stelle des intakten v<m4-Gens kodierend fur die a-Untereinheit 
der Vanillinsaure-Demethylase. 

15 26. Pseudomonas sp. HR199v<2/?/iQGm ? enthaltend das durch QGm inaktivierte 

vanA-Gm an Stelle des intakten v<3/7.4-Gens kodierend fur die a-Untereinheit 
der Vanillinsaure-Demethylase. 

27. Pseudomonas sp. HR\99vanAA, enthaltend das durch Deletion inaktivierte 
vanA-Gen an Stelle des intakten vanA-Gens kodierend fur die a-Untereinheit 

20 der Vanillinsaure-Demethylase. 

28. Pseudomonas sp. HR199wmi?QKm, enthaltend das durch QKm inaktivierte 
vanB-Gen an Stelle des intakten vanB-Gens kodierend fur die p-Untereinheit 
der Vanillinsaure-Demethylase. 

29. Pseudomonas sp. HR199vaw J BQGm, enthaltend das durch QGm inaktivierte 
25 vanB-Gen an Stelle des intakten vanB-Gens kodierend fur die p-Untereinheit 

der Vanillinsaure-Demethylase. 

30. Pseudomonas sp. HR199v<mSA, enthaltend das durch Deletion inaktivierte 
vanB-Gen an Stelle des intakten vanB-Gens kodierend fur die p-Untereinheit 
der Vanillinsaure-Demethylase. 

30 



WO 00/26355 



PCT/EP99/07952 



Gegenstand der Erfindung ist auBerdem ein Verfahren zur biotechnischen Herstel- 
lung von organischen Verbindungen. Insbesondere konnen mit diesem Verfahren 
Alkohole, Aldehyde und organische Sauren hergestellt werden. Vorzugsweise han- 
delt es sich hierbei um Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin und 
Vanillinsaure. 

In dem erfindungsgemafien Verfahren werden die oben beschriebenen Organismen 
eingesetzt. Zu den ganz besonders bevorzugten Organismen gehoren Bakterien, ins- 
besondere die Pseudomonas- Axtcn. Im einzelnen konnen die oben genannten Pseu- 
domonas-Artcn vorzugsweise fur folgende Verfahren eingesetzt werden: 

1. Pseudomonas sp. HR199c#/v4QKm, Pseudomonas sp. WR\99calAQGm und 
Pseudomonas sp. HR\99calAA zur Herstellung von Coniferylalkohol aus 
Eugenol, 

2. Pseudomonas sp. HR\99calBQKm, Pseudomonas sp. HRl99calBQGm und 
Pseudomonas sp. HR199ca/Z?A zur Herstellung von Coniferylaldehyd aus 
Eugenol oder Coniferylalkohol. 

3. Pseudomonas sp. HR199/csQKm, Pseudomonas sp. HR199/csQGm, Pseu- 
domonas sp. HR199fcsA, Pseudomonas sp. HR\99echQKm, Pseudomonas 
sp. HR199ec/*QGm und Pseudomonas sp. HR199ec/zA zur Herstellung von 
Ferulasaure aus Eugenol oder Coniferylalkohol oder Coniferylaldehyd. 

4. Pseudomonas sp. HR199v<#*QKm, Pseudomonas sp. HR199vdftQGm, Pseu- 
domonas sp. HRl99vdhA y Pseudomonas sp. HRl99vdhQGmvdhBQKm, 
Pseudomonas sp. HRl99vdhQ.KmvdhBQ.Gm, Pseudomonas sp. 
HR\99vdhAvdhBQGm und Pseudomonas sp. HR\99vdhAvdhBQKm zur 
Herstellung von Vanillin aus Eugenol oder Coniferylalkohol oder Coni- 
ferylaldehyd oder Ferulasaure. 
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5. Pseudomonas sp. HR199va«^QKm, Pseudomonas sp. HR199v<m4QGm, 
Pseudomonas sp. HR1 99vanA A, Pseudomonas sp. HR1 99vaA?5QKm, 
Pseudomonas sp. HR1 99ra>?BQGm und Pseudomonas sp. HR199van£A zur 
Herstellung von Vanillinsaure aus Eugenol oder Coniferylalkohol oder 
Coniferylaldehyd oder Ferulasaure oder Vanillin. 

Bevorzugtes Substrat ist Eugenol. Jedoch kann der Zusatz weiterer Substrate oder 
sogar der Austausch des Eugenol gegen ein anderes Substrat moglich sein. 

Als Nahrmedium fur die erfindungsgemaB eingesetzten Organismen kommen syn- 
thetische, halbsynthetische oder komplexe Kulturmedien in Betracht. Diese konnen 
kohlenstoffhaltige und stickstoffhaltige Verbindungen, anorganische Salze, gegebe- 
nenfalls Spurenelemente sowie Vitamine enthalten. 

Als kohlenstoffhaltige Verbindungen konnen Kohlenhydrate, Kohlenwasserstoffe 
oder organische Grundchemikalien in Betracht kommen. Beispiele fiir vorzugsweise 
verwendbare Verbindungen sind Zucker, Alkohole bzw. Zuckeralkohole, organische 
Sauren oder komplexe Gemische. 

Als Zucker kommt vorzugsweise Glucose in Betracht. Als organische Sauren konnen 
vorzugsweise Zitronensaure oder Essigsaure zum Einsatz kommen. Zu den kom- 
plexen Gemischen zahlen z. B. Malzextrakt, Hefeextrakt, Casein oder Caseinhydro- 
lysat. 

Als stickstoffhaltige Substrate kommen anorganische Verbindungen in Betracht. Bei- 
spiele hierfur sind Nitrate und Ammoniumsalze. Ebenso konnen organische Stick- 
stoffquellen zum Einsatz kommen. Hierzu zahlen Hefeextrakt, Sojamehl, Casein, 
Caseinhydrolysat und Maisquellwasser. 



WO 00/26355 



- 11 - 



PCT/EP99/07952 



Zu den einsetzbaren anorganischen Salzen zahlen beispielsweise Sulfate, Nitrate, 
Chloride, Carbonate und Phosphate. Als Metalle enthalten die genannte Salze vor- 
zugsweise Natrium, Kalium, Magnesium, Mangan, Calcium, Zink und Eisen. 

5 Die Temperatur fur die Kultivierung liegt vorzugsweise im Bereich von 5 bis 100°C 
Besonders bevorzugt ist der Bereich von 15 bis 60°C, hochst bevorzugt sind 22 bis 
37°C. 

Der pH-Wert des Mediums betragt bevorzugt 2 bis 12. Besonders bevorzugt ist der 
10 Bereich von 4 bis 8. 

Grundsatzlich konnen fur die Durchfuhrung des erfindungsgemaBen Verfahrens alle 
dem Fachmann bekannten Bioreaktoren eingesetzt werden. Vorzugsweise kommen 
alle fur Submersverfahren geeigneten Vorrichtungen in Betracht. Das heiBt, es 
15 konnen erfindungsgemaB GefaBe ohne oder mit mechanischer Mischeinrichtung ein- 
gesetzt werden. Zu ersteren zahlen z. B. Schuttelapparaturen, Blasensaulen- oder 
Schlaufenreaktoren. Zu letzteren gehoren vorzugsweise alle bekannten Vorrichtun- 
gen mit Ruhrern in beliebiger Gestaltung. 

20 Das erfindungsgemaBe Verfahren kann kontinuierlich oder diskontinuierlich durch- 
gefiihrt werden. Die Dauer der Fermentation bis zum Erreichen einer maximalen 
Produktmenge hangt von der speziellen Art des eingesetzten Organismus ab. Grund- 
satzlich liegen die Zeiten der Fermentation jedoch zwischen 2 und 200 Stunden. 

25 Im folgenden wird die Erfmdung unter Bezugnahme auf Beispiele naher erlautert: 

Von dem Eugenol verwertenden Stamm Pseudomonas sp. HR199 (DSM 7063) wur- 
den gezielt Mutanten erzeugt, wobei spezifisch Gene des Eugenol-Katabolismus 
durch Insertion von Omega-Elementen oder durch Einflihren von Deletionen inakti- 
30 viert wurden. Als Omega-Elemente dienten DNA-Abschnitte die fur Antibiotika- 
resistenzen gegen Kanamycin (QKm) und Gentamycin (QGm) codierten. Diese 
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Resistenzgene wurden ausgehend von Tn5 und dem Plasmid pBBRlMCS-5 mit 
Hilfe von Standardmethoden isoliert. Die Gene calA, calB,fcs, ech, aat, vdh, adh, 
vdhB, vanA und vanB, die fur Coniferylalkohol-Dehydrogenase, Coniferylaldehyd- 
Dehydrogenase, Ferulasaure-CoA Synthetase, Enoyl-CoA Hydratase-Aldolase, beta- 

5 Ketothiolase, Vanillin-Dehydrogenase, Alkohol-Dehydrogenase, Vanillin-Dehydro- 

genase II und Vanillinsaure-Demethylase codieren wurden ausgehend von genomi- 
scher DNA des Stammes Pseudomonas sp. HR199 mit Hilfe von Standardmethoden 
isoliert und in pBluescript SK kloniert. Aus diesen Genen wurden durch Verdauung 
mit geeigneten Restriktionsendonukleasen DNA-Abschnitte entfernt (Deletion), bzw 

10 durch Q-Elemente substituiert (Insertion), wodurch das jeweilige Gen inaktiviert 
wurde. Die auf diese Weise mutierten Gene wurden in konjugativ ubertragbare Vek- 
toren umkloniert und anschlieBend in den Stamm Pseudomonas sp. HR199 einge- 
fiihrt. Durch geeignete Selektion wurden Transkonjuganten erhalten, die das jeweils 
funktionsfahige wildtyp-Gen gegen das neu eingebrachte inaktivierte Gen ausge- 

1 5 tauscht hatten. Die so erhaltenen Insertions- und Deletionsmutanten wiesen nur noch 
das jeweils inaktivierte Gen auf. Auf diese Weise wurden sowohl Mutanten mit nur 
einem defekten Gen als auch Mehrfachmutanten, in denen mehrere Gene auf diese 
Weise inaktiviert wurden, erhalten. Diese Mutanten wurden fur die Biotransforma- 
tion von 

20 a) Eugenol zu Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin und/oder 
Vanillinsaure; 

b) Coniferylalkohol zu Coniferylaldehyd, Ferulasaure, Vanillin und/oder 
Vanillinsaure; 

c) Coniferylaldehyd zu Ferulasaure, Vanillin und/oder Vanillinsaure; 
25 d) Ferulasaure zu Vanillin und/oder Vanillinsaure und 

e) Vanillin zu Vanillinsaure eingesetzt. 
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Material und Methoden 
Wachstumsbcdingungen der Baktericn. 

Stamme von Escherichia colt wurden bei 37°C in Luria-Bertani (LB) oder M9-Mine- 
5 ralmedium (Sambrook, J., E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a 
laboratory manual. 2. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring 
Harbor, New York.) angezogen. Stamme von Pseudomonas sp. wurden bei 30°C in 
Nutrient Broth (NB, 0,8%, wt/vol) oder in Mineralmedium (MM) (Schlegel, H, G. et 
al. 1961. Arch. Mikrobiol. 38:209-222) bzw. HR-Mineralmedium (HR-MM) 

10 (Rabenhorst, J. 1996. AppL Microbiol. BiotechnoL 46:470-474.) angezogen. Ferula- 
saure, Vanillin, Vanillinsaure und Protocatechusaure wurden* in Dimethylsulfoxid 
gelost, und dem jeweiligen Medium in einer Endkonzentration von 0.1% (wt/vol) 
zugesetzt. Eugenol wurde dem Medium direkt in einer Endkonzentration von 0.1% 
(vol/vol) zugesetzt, bzw. in den Deckel von MM-Agarplatten auf Filterpapier 

15 (Rundfilter 595, Schleicher & Schuell, Dassel, Deutschland) appliziert. Bei der 
Anzucht von Transkonjuganten und Mutanten von Pseudomonas sp. wurde Tetra- 
cyclic Kanamycin, und Gentamycin in Endkonzentrationen von 25 |LLg/mI bzw. 100 
^ig/ml bzw. 7,5 ng/ml eingesetzt. 

20 Qualitativer und quantitativer Nachweis von Stoffwechselintcrmediaten in Kul- 
turuberstanden. 

Kulturuberstande wurden direkt, bzw, nach Verdiinnung mit H20-bidest. mittels 
Hochdruck-Flussigkeits-Chromatographie (Knauer-HPLC) analysiert. Die Chroma- 
tographic erfolgte an Nucleosil-100 CI 8 (7 fxm, 250 x 4 mm), Als Losungsmittel 
25 diente 0.1% (vol/vol) Ameisensaure und Acetonitril. Der verwendete Gradient zur 
Elution der Substanzen verlief wie folgt: 

00:00 - 06:30 26% Acetonitril 
06:30 - 08:00 100% Acetonitril 
30 08:00 - 12:00 100% Acetonitril 
12:00 - 13:00 -> 26% Acetonitril 
13:00 - 18:00 -» 26% Acetonitril 
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Reinigung der Vanillin-Dehydrogenase-IL 

Die Aufreinigung erfolgte bei 4°C. 

Rohextrakt. 

Auf Eugenol angezogene Zellen von Pseudomonas sp. HR199 wurden in 10 mM 
Natriumphosphat-Puffer, pH 6.0 gewaschen, im gleichen Puffer resuspendiert und 
durch zweimalige Passage einer French-Presse (Amicon, Silver Spring, Maryland, 
USA) bei einem Druck von 1000 psi aufgeschlossen. Das Zellhomogenat wurde 
einer Ultrazentrifugation (1 h, 100 000 x g, 4°C) unterzogen,.wodurch die losliche 
Fraktion des Rohextraktes als Uberstand erhalten wurde. 

Anionenaustauschchromatographie an DEAE-Sephacel. 

Die losliche Fraktion des Rohextraktes wurde uber Nacht gegen 10 mM Natrium- 
phosphat-Puffer, pH 6.0 dialysiert. Das Dialysat wurde auf eine mit 10 mM 
Natriumphosphat-Puffer, pH 6.0 aquilibrierte DEAE-Sephacel-Saule (2,6 cm x 35 
cm, Bettvolumen[BV]: 186 ml) mit einer DurchfluBrate von 0.8 ml/min aufgetragen. 
Die Saule wurde mit zwei BV 10 mM Natriumphosphat-Puffer, pH 6.0 gespult. Die 
Elution der Vanillin-Dehydrogenase-II (VDH-II) erfolgte mit einem linearen Salz- 
gradient von 0 bis 400 mM NaCl in 10 mM Natriumphosphat-Puffer, pH 6.0 (750 
ml). Es wurden 10 ml-Fraktionen aufgefangen. Fraktionen mit hoher VDH-II-Akti- 
vitat wurden zum DEAE-Pool vereinigt. 

Bestimmung der Vanillin-Dehydrogenase-Aktivitat. 

Die Bestimmung der VDH-Aktivitat erfolgte bei 30°C durch einen optisch enzyma- 
tischen Test. Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0.1 mmol 
Kalium-Phosphat (pH 7.1), 0.125 \imo\ Vanillin, 0.5 ^imol NAD, 1.2 (irnol Pyruvat 
(Na-Salz), Lactat-Dehydrogenase (1 U; aus Schweineherz ) und Enzymlosung. Die 
Oxidation von Vanillin wurde bei X = 340 nm verfolgt (^vanillin = 1 U6 cm 2 /|amol). 
Die Enzymaktivitat wurde in Einheiten (U) angegeben, wobei 1 U der Enzymmenge 
entspricht, die 1 jimol Vanillin pro Minute umsetzt. Die Proteinkonzentrationen in 
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den Proben wurden nach Lowry et al. (Lowry, O. R, N. J. Rosebrough, A. L. Farr 
und R. J. Randall. 1951. J. Biol. Chem. 193:265-275) bestimmt. 

Bcstimmung der Coniferylalkohol-Dehydrogenase-Aktivitat. 

Die Bestimmung der CADH-Aktivitat erfolgte bei 30°C durch einen optisch enzy- 
matischen Test nach Jaeger et al. (Jaeger, E., L. Eggeling und H. Sahm. 1981. 
Current Microbiology. 6:333-336). Der Reaktionsansatz mit einem Volumen von 
1 ml enthielt 0,2 mmol Tris/HCI (pH 9.0), 0.4 fimol Coniferylalkohol, 2 pimol NAD, 
0.1 mmol Semicarbazid und Enzymlosung. Die Reduktion von NAD wurde bei X = 
340 nm verfolgt (s = 6.3 cm^/^mol). Die Enzymaktivitat wurde in Einheiten (U) 
angegeben, wobei 1 U der Enzymmenge entspricht, die 1 ^imol Substrat pro Minute 
umsetzt. Die Proteinkonzentrationen in den Proben wurden nach Lowry et al. 
(Lowry, O. R, N. J. Rosebrough, A. L. Farr und R. J. Randall. 1951. J. Biol. Chem. 
193:265-275) bestimmt. 

Bestimmung der Coniferylaldehyd-Dehydrogenase-Aktivitat. 

Die Bestimmung der CALDH-Aktivitat erfolgte bei 30°C durch einen optisch enzy- 
matischen Test. Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0.1 mmol 
Tris/HCI (pH 8.8), 0.08 nmol Coniferylaldehyd, 2.7 jimol NAD und Enzymlosung. 
Die Oxidation von Coniferylaldehyd zu Ferulasaure wurde bei X = 400 nm verfolgt 
(e = 34 cm^/^imol). Die Enzymaktivitat wurde in Einheiten (U) angegeben, wobei 1 
U der Enzymmenge entspricht, die 1 jimol Substrat pro Minute umsetzt. Die Pro- 
teinkonzentrationen in den Proben wurden nach Lowry et al. (Lowry, O. R, N, J. 
Rosebrough, A. L. Farr und R. J. Randall. 1951. J. Biol. Chem. 193:265-275) 
bestimmt. 

Bestimmung der Ferulasaure-CoA-Synthetase (Ferulasaure-Thiokinase)-Aktivi- 
tat. 

Die Bestimmung der FCS-Aktivitat erfolgte bei 30°C durch einen optisch enzyma- 
tischen Test, modifiziert nach Zenk et al. (Zenk et al. 1980, Anal. Biochem. 101:182- 
187). Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0.09 mmol Kalium- 
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Phosphat (pH 7.0), 2.1 (imol MgCl2, 0.7 jamol Ferulasaure, 2 j^mol ATP, 0.4 [imo\ 
Coenzym A und Enzymlosung. Die Entstehung des CoA-Esters aus Ferulasaure 
wurde bei X = 345 nm verfolgt (e = 10 cm^/jimol). Die Enzymaktivitat wurde in 
Einheiten (U) angegeben, wobei 1 U der Enzymmenge entspricht, die 1 (imol Sub- 
5 strat pro Minute umsetzt. Die Proteinkonzentrationen in den Proben wurden nach 

Lowry et al. (Lowry, O. H., N. J. Rosebrough, A. L. Farr und R. J. Randall. 1951. J. 
Biol. Chem. 193:265-275) bestimmt 

Electrophoretische Methoden. 

10 Die Auftrennung von proteinhaltigen Extrakten erfolgte in 7.4% (wt/vol) Poly- 

acrylamidgelen unter nativen Bedingungen nach der Methode von Stegemann et al. 
(Stegemann et al. 1973. Z. Naturforsch. 28c:722-732) und unter denaturierenden 
Bedingungen in 1 1.5% (wt/vol) Polyacrylamidgelen nach der Methode von Laemmli 
(Laemmli, U. K. 1970. Nature (London) 227:680-685). Zur unspezifischen Protein- 

15 farbung wurde Serva Blue R verwendet. Zur spezifischen Anfarbung der Conife- 

rylalkohol-, Coniferylaldehyd- und Vanillin-Dehydrogenase wurden die Gele fur 20 
min in 100 mM KP-Puffer (pH 7.0) umgepuffert und anschlieflend bei 30°C im glei- 
chen Puffer dem 0.08% (wt/vol) NAD, 0.04% (wt/vol) p-Nitroblau-Tetrazolium- 
chlorid, 0.003% (wt/vol) Phenazine-Methosulfat und 1 mM des jeweiligen Substrates 

20 zugesetzt worden war inkubiert, bis entsprechende Farbbanden sichtbar wurden. 

Transfer von Proteinen aus Polyacrylamidgelen auf PVDF-Membranen. Pro- 
teine wurden aus SDS-Polyacrylamidgelen mit Hilfe eines Semidry-Fastblot Gerates 
(B32/33, Biometra, Gottingen, Deutschland) nach Herstellerangaben auf PVDF- 
25 Membranen (Waters-Milipore, Bedford, Mass., USA) ubertragen. 

Bestimmung von N-terminalcn Aminosauresequenzen. 

Die Bestimmung von N-terminalen Aminosauresequenzen erfolgte mit Hilfe eines 
Protein Peptide Sequenzers (Typ 477 A, Applied Biosystems, Foster City, USA) und 
30 eines PTH-Analysers nach Herstellerangaben. 
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Isolierung und Manipulation von DNA. 

Die Isolierung von genomischer DNA erfolgte nach der Methode von Marmur 
(Marmur, J. 1961. J. Mol. Biol. 3:208-218). Die Isolierung und Analyse von anderer 
Plasmid-DNA bzw. von DNA-Restriktionsfragmenten erfolgte nach Standardmetho- 
den (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a labora- 
tory manual. 2. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring Habor, 
New York.). 

Transfer von DNA. 

Die Preparation und Transformation von kompetenten Escherichia co//-Zellen 
erfolgte nach der Methode von Hanahan (Hanahan, D. 1983. J. Mol. Biol. 166:557- 
580). Konjugativer Plasmidtransfer zwischen Plasmid-tragenden Escherichia coli 
S17-1-Stammen (Donor) und Pseudomonas sp.-Stammen (Rezipient) erfolgte auf 
NB-Agarplatten nach der Methode von Friedrich et al. (Friedrich, B. et al. 1981. J. 
Bacteriol. 147:198-205), oder durch eine "Minikomplementations-Methode" auf 
MM-Agarplatten mit 0.5% (wt/vol) Gluconat als C-Quelle und 25 (ig/ml Tetracyclin 
oder 1 00 ng/ml Kanamycin. Dabei wurden Zellen des Rezipienten in einer Richtung 
als Impfstrich aufgetragen. Nach 5 min wurden dann Zellen der Donor-Stamme als 
Impfstriche aufgetragen, wobei der Rezipienten-Impfstrich gekreuzt wurde. Nach 
einer Inkubation fur 48 h bei 30°C wuchsen die Transkonjuganten direkt hinter der 
Kreuzungsstelle, wohingegen weder Donor- noch Rezipienten-Stamm zum Wachs- 
tum in der Lage war. 

Hybridisierungsexpcrimente. 

DNA-Restriktionsfragmente wurden in einem 0.8% (wt/vol) Agarose-Gel in 50 mM 
Tris- 50 mM Borsaure- 1.25 mM EDTA-Puffer (pH 8.5) elektrophoretisch aufge- 
trennt (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a 
laboratory manual. 2. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring 
Habor, New York.). Die Ubertragung der denaturierten DNA aus dem Gel auf eine 
positiv geladene Nylonmembran (PorengroBe: 0.45 |im, Pall Filtrationstechnik, Drei- 
eich, Deutschland), die anschlieBende Hybridisierung mit biotinylierten, bzw. 
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Digoxigenin-markierten DNA-Sonden und die Herstellung dieser DNA-Sonden 
erfolgte nach Standardmethoden (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. 
Molecular cloning: a laboratory manual. 2. AufL, Cold Spring Harbor Laboratory 
Press, Cold Spring Habor, New York.). 

DNA-Sequenzierung. 

Die Bestimmung von Nukleotidsequenzen erfolgte nach der Didesoxy-Kettenab- 
bruch-Methode von Sanger et al. (Sanger et al. 1977. Proc. Natl. Acad. Sci. USA 
74:5463-5467) "nicht-radioaktiv" mit einem "LI-COR DNA-Sequencer Modell 
4000L" (LI-COR Inc., Biotechnology Division, Lincoln, NE,_USA) unter Verwen- 
dung eines "Thermo Sequenase fluorescent labelled primer cycle sequencing kit with 
7-deaza-dGTP" (Amersham Life Science, Amersham International pis, Little 
Chalfont, Buckinghamshire, England) jewei is nach Vorschrift des Herstellers. 

Mit Hilfe von synthetischen Oligonukleotiden wurde nach der "Primer-hopping 
Strategic" von Strauss et al. (Strauss, E. C. et al. 1986. Anal. Biochem. 154:353-360) 
sequenziert. 

Chemikalien, Biochemikalien und Enzyme. 

Restriktionsenzyme, T4 DNA-Ligase, Lambda-DNA und Enzyme bzw. Substrate fur 
die optisch enzymatischen Tests wurden von C. F. Boehringer & Sohne (Mannheim, 
Deutschland) oder von GIBCO/BRL (Eggenstein, Deutschland) bezogen. [y- 
32 P]ATP kam von Amersham/Buchler (Braunschweig, Deutschland). Oligonukleo- 
tide wurden von der Firma MWG-Biotech GmbH (Ebersberg, Deutschland) bezogen. 
Agarose vom Typ NA wurde von Pharmacia-LKB (Uppsala, Schweden) bezogen. 
Alle anderen Chemikalien waren von Haarmann & Reimer (Holzminden, Deutsch- 
land), E. Merck AG (Darmstadt, Deutschland), Fluka Chemie (Buchs,, Schweiz), 
Serva Feinbiochemica (Heidelberg, Deutschland) oder Sigma Chemie (Deisenhofen, 
Deutschland). 
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Beispiele 
Beispicl 1 

5 Konstruktion von Omega-Elementen, die Resistenzen gegeniiber Kanamycin (Q 
Km) bzw. Gentamycin( QGm) vermittelm 

Fur die Konstruktion des QKm-Elements wurde das 2099 bp Z?g/I-Fragment des 
Transposons Tn5 (Auerswald E. A., G. Ludwig und H. Schaller. 1981. Cold Spring 
Harb. Symp. Quant. Biol. 45:107-113; Beck E., G. Ludwig, E. A. Auerswald, B. 

10 Reiss und H. Schaller. 1982. Gene 19:327-336; Mazodier P., P. CossarU E. Giraud 
und F. Gasser. 1985. Nucleic Acids Res. 13:195-205.) praparativ isoliert. Das Frag- 
ment wurde durch Behandlung mit der Nuklease Bal-31 auf ca. 990 bp verkurzt. 
Dieses Fragment, das nur noch das Kanamycin-Resistenzgen (codierend fur eine 
Aminoglycosid-3'-0-Phosphotransferase) umfaBte, wurde anschlieBend mit Smal 

15 geschnittener pSKsym-DNA (pBIuescript SK"-Derivat, welches eine symetrisch auf- 
gebaute multiple Klonierungsstelle [Sail, Hindlll, EcoRl, Smal, EcoRU Hindlll, Sail] 
enthalt) ligiert. Aus dem resultierenden Plasmid konnte das fiKm-Element als Smal-, 
EcoRl-, Hindlll- oder &/I-Fragment reisoliert werden. 

20 Fur die Konstruktion des QGm-Elements wurde das 983 bp £<7<?I-Fragment des 
Plasmids pBBRlMCS-5 (Kovach M.E., P. H. Elzer, D. S. Hill, G. T. Robertson, M. 
A. Farris, R. M. Roop und K. M, Peterson. 1995. Gene 166:175-176.) praparativ iso- 
liert und anschlieBend mit Mung Bean Nuklease (Abdauen von einzelstrangigen 
DNA-Molekulenden) behandelt. Dieses Fragment, das nur noch das Gentamycin- 

25 Resistenzgen (codierend fur eine Gentamycin-3-Acetyltransferase) umfaBte, wurde 
anschlieBend mit Smal geschnittener pSKsym-DNA (s.o.) ligiert. Aus dem resultie- 
renden Plasmid konnte das QGm-Element als Smal-, EcoRl-, HindlU- oder Sail- 
Fragment reisoliert werden. 
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BeispicI 2 

Klonierung der Gene aus Pseudomonas sp. HR199 (DSM7063), die durch Inser- 
tion von Q-Elementen oder durch Deletionen inaktiviert werden sollten. 

5 Die separaten Klonierungen der Gene fcs, ech, vdh und aat erfolgte ausgehend von 
den £ coli S17-1 Stammen DSM 10439 und DSM 10440 mit den Plasmiden pE207 
und pE5-l (siehe EP-A 0845532). Aus diesen Plasmiden wurden die angegebenen 
Fragmente praparativ isoliert und wie im weiteren beschrieben behandelt: 

10 Fur die Klonierung des yes-Gens wurde das 2350 bp grofle Sail/ EcoRl-Fragment des 
Plasmids pE207 und das 3700 bp groBe EcoKVSall-V mgmcni des Plasmids pE5-l 
zusammen in pBluescript SK" in einer Weise kloniert, daB beide Fragmente iiber die 
ZscoRI-Enden miteinander verbunden waren. Ausgehend von dem resultierenden 
Hybridplasmid wurde das 6050 bp Sa/I-Fragment praparativ isoliert und durch 

15 Behandlung mit der Nuklease Bal-31 auf ca. 2480 bp verkiirzt. AnschlieBend wurden 
an die Fragment-Enden Ps/I-Linker ligiert und das Fragment nach PM-Verdauung in 
pBluescript SK" kloniert (pSK/cs). Nach Transformation von E. coli XL 1 -Blue wur- 
den Klone erhalten, die das /c5-Gen exprimierten und eine FCS-Aktivitat von 0.2 
U/mg Protein aufwiesen. 

20 

Fur die Klonierung des ech-Gens wurde das 3800 bp groBe ///«dIII/£coRI-Fragment 
des Plasmids pE207 praparativ isoliert und durch Behandlung mit der Nuklease Bal- 
31 auf ca. 1470 bp verkiirzt. AnschlieBend wurden an die Fragment-Enden EcoRl- 
Linker ligiert und das Fragment nach £coRI-Verdauung in pBluescript SK" kloniert 
25 (pS¥Lech). 

Fur die Klonierung des vdh-Gens wurde das 2350 bp groBe Sa/I/£coRJ-Fragment des 
Plasmids pE207 praparativ isoliert. Nach Klonierung in pBluescript SK" wurde das 
Fragment mit Hilfe eines Exonuklease III/ Mung Bean Nukleasesystems einseitig 
30 urn ca. 1530 bp verkiirzt. AnschlieBend wurde an das Fragmentende ein £coRl- 
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Linker ligiert und das Fragment nach £coRI-Verdauung in pBluescript SK" kloniert 
(pSKvdh). Nach Transformation von E. coli XLl-Blue wurden Klone erhalten, die 
das vdh-Gen exprimierten und eine VDH-Aktivitat von 0.01 U/mg Protein 
aufwiesen. 

5 

Fur die Klonierung des aat-Gens wurde das 3700 bp groBe £coRI/Sa/I-Fragment des 
Plasmids pE5-l praparativ isoliert und durch Behandlung mit der Nuklease Bal-31 
auf ca. 1590 bp verkiirzt. AnschlieBend wurden an die Fragment-Enden EcoRl- 
Linker ligiert und das Fragment nach £coRI-Verdauung in pBluescript SK" kloniert 
10 (pSKatff). 

Beispiel 3 

Inaktivierung der oben beschriebenen Gene durch Insertion von Q-EIcmenten, 
15 bzw durch Deletion von Teilbereichen dieser Gene. 

Das Plasmid pSK/cs, welches das fcs-Gen enthielt wurde mit fc^HII verdaut, 
wodurch ein 1290 bp groBes Fragment aus dem fcs-Gtn herausgeschnitten wurde. 
Nach Religation wurde das Deletions-Derivat des fcs-Gens (fcsA) (siehe Abb. li und 
2i) kloniert in pBluescript SK" (pSK/csA) erhalten. Dariiber hinaus wurden nach 

20 Herausschneiden des Fragments die Omega-Elemente QKm und QGm an dessen 
Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des fcs~Gens (fcsQ. 
Km, siehe Abb. lg und 2g) und (fcsQ.Gm, siehe Abb. lh und 2h) kloniert in 
pBluescript SK" (pSK/csQKm und pSK/csQGm). In Rohextrakten der erhaltenen E. 
coli Klone, deren Hybridplasmide ein durch Deletion bzw, Q-Element-Insertion 

25 inaktiviertes yes-Gen aufwiesen, konnte keine FCS-Aktivitat nachgewiesen werden. 

Das Plasmid pSKec/z, welches das ech-Gen enthielt, wurde mit Nrul verdaut, 
wodurch ein 53 bp und ein 430 bp groBes Fragment aus dem ech-Gen herausge- 
schnitten wurde. Nach Religation wurde das Deletions-Derivat des ec/z-Gens (echA, 
30 siehe Abb. 11 und 21) kloniert in pBluescript SK" (pSKecAA) erhalten. Daruber 
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hinaus wurden nach Herausschneiden der Fragmente die Omega-Elemente QKm und 
QGm an deren Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des 
ec/z-Gens (echQKm und echQGm) kloniert in pBluescript SK" (pSKec/zQKm und 
pSKechnGm). 

5 

Das Plasmid pSKW/z, welches das vdh-Gen enthielt wurde mil i&sHII verdaut, 
wodurch ein 210 bp groBes Fragment aus dem vdh-Gen herausgeschnitten wurde. 
Nach Religation wurde das Deletions-Derivat des vdh-Gcns (vdhA^ siehe Abb. lo 
und 2o) kloniert in pBluescript SK" (pSKvdhA) erhalten. Daruber hinaus wurden 

10 nach Herausschneiden des Fragments die Omega-Elemente .QKm und QGm an 
dessen Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des vdh- 
Gens (W/zQKm und vdhQGm) kloniert in pBluescript SK" (pSKv^/zQKm, siehe 
Abb. Irn und 2m) und (pSKvd/zQGm, siehe Abb. In und 2n). In Rohextrakten der 
erhaltenen E. coli Klone, deren Hybridplasmide ein durch Deletion bzw. Q-Element- 

15 Insertion inaktiviertes vdh-Gen aufwiesen, konnte keine VDH-Aktivitat nachge- 
wiesen werden. 

Das Plasmid pSKaat, welches das <za/-Gen enthielt wurde mit ZfosHII verdaut, 
wodurch ein 59 bp groBes Fragment aus dem aat-Gen herausgeschnitten wurde. 

20 Nach Religation wurde das Deletions-Derivat des a#/-Gens (aatA^ siehe Abb. lr und 
2r) kloniert in pBluescript SK" (pSKaatA) erhalten. Dariiber hinaus wurden nach 
Herausschneiden des Fragments die Omega-Elemente QKm und QGm an dessen 
Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des aa/-Gens (aat 
QKm, siehe Abb. Ip und 2p) und (aaiQGm, siehe Abb. Iq und 2q) kloniert in 

25 pBluescript SK" (pSKaa/QKm und pSKa^/QGm). 
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Beispiel 4 

Umklonieren der durch Q-Elcmente inaktivierten Gene in das konjugativ uber- 
tragbare "Suizid-Piasmid" pSUP202. 

5 Um die durch Q-Elemente inaktivierten Gene in Pseudomonas sp. HR199 gegen die 
intakten Gene austauschen zu konnen, benotigt man einen Vektor, der einerseits in 
Pseudomonaden iibertragen werden kann (konjugativ iibertragbare Piasmide), ande- 
rerseits dort jedoch nicht repliziert werden kann und somit in Pseudomonaden insta- 
bil ist ("Suizid-Plasmid' 1 ). DNA-Abschnitte, die mit Hilfe eines solchen Plasmid- 

10 systems in Pseudomonaden iibertragen werden, konnen nur erhalten bleiben, wenn 
sie durch homologe Rekombination (RecA-abhangige Rekombination) in das Genom 
der Bakterienzelle integriert werden. Im vorliegenden Fall wurde das "Suizid- 
Plasmid" pSUP202 (Simon et al. 1983. In: A. Puhler. Molecular genetics of the 
bacteria-plant interaction. Springer Verlag, Berlin, Heidelberg, New York, S. 98- 

15 106.) eingesetzt. 

Die inaktivierten Gene fcsQ.Km und ^QGm wurden nach Ps/I-Verdauung aus den 
Plasmiden pSK/c.yQKm und pSK/b^QGm isoliert und mit Pstl geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli SI 7-1 transfor- 
20 miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
Hybridplasmid (pSUP/c^QKm) das inaktivierte Gen fcsQKm enthielt. Das entspre- 
chende Hybridplasmid (pSUP/csQGm) der Gentamycin- resistenten Transformanden 
enthielt das inaktivierte Gen fcsQGm. 

25 

Die inaktivierten Gene echOKm und echCIGm wurden nach £"coRI-Verdauung aus 
den Plasmiden pSKec/zQKm und pSKec/zQGm isoliert und mit EcoRl geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli SI 7-1 transfor- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
30 bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
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Hybridplasmid (pSUPec/zQKm) das inaktivierte Gen ec/zQKm enthielt. Das entspre- 
chende Hybridplasmid (pSUPec/zQGm) der Gentamycin- resistenten Transforman- 
den enthielt das inaktivierte Gen ec/zQGm. 

5 Die inaktivierten Gene vdhQKm und v^QGm wurden nach £coRI-Verdauung aus 

den Plasmiden pSKvdhQKm und pSKvdhQ.Gm isoliert und mit EcoRI geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli SI 7-1 transfer- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
10 Hybridplasmid (pSUPvd/zQKm) das inaktivierte Gen vrf/^QKm. enthielt. Das entspre- 

chende Hybridplasmid (pSUPv<#iQGm) der Gentamycin- resistenten Transforman- 
den enthielt das inaktivierte Gen vdhQGm. 

Die inaktivierten Gene aatDKm und aatQ&m wurden nach £coRI-Verdauung aus 
15 den Plasmiden pSK^a/QKm und pSKaa/QGm isoliert und mit EcoRI geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli SI 7-1 transfor- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
Hybridplasmid (pSUPaa/QKm) das inaktivierte Gen aaiQKm enthielt. Das entspre- 
20 chende Hybridplasmid (pSUPa<2fQGrn) der Gentamycin- resistenten Transformanden 
enthielt das inaktivierte Gen aatdGm. 

Beispiel 5 

25 Umklonieren der durch Deletion inaktivierten Gene in das konjugativ iiber- 

tragbare "Suizid-PIasmid" mit "sacB-Selektionssystem" pHE55. 

Um die durch Deletion inaktivierten Gene in Pseudomonas sp. HR199 gegen die 
intakten Gene austauschen zu konnen, benotigt man einen Vektor, der die schon fur 
pSUP202 beschriebenen Eigenschaften aufweist. Da im Gegensatz zu den durch Q- 
30 Element inaktivierten Genen bei durch Deletion inaktivierten Genen keine Selek- 
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tionsmoglichkeit (keine Antibiotika-Resistenz) fur den erfolgten Austausch der Gene 
in Pseudomonas sp. HR199 besteht, muBte ein anderes Seleklionssystem zur 
Anwendung kommen. Bei dem M sac5-Selektionssystem" wird das auszutauschende, 
durch Deletion inaktivierte Gen in einem Plasmid kloniert, welches neben einem 
Antibiotika-Resistenzgen auch uber das sacB-Gen verfugt. Nach konjugativer Uber- 
tragung dieses Hybridplasmids in einen Pseudomonaden wird das Plasmid durch 
homologe Rekombination an der Stelle in das Genom integriert, an der sich das 
intakte Gen befindet (erster "Cross over"). Auf diese Weise entsteht ein "heteroge- 
noter" Stamm, der sowohl uber ein intaktes als auch uber ein durch Deletion inakti- 
viertes Gen verfugt, welche durch die pHE55-DNA voneinander getrennt sind. Diese 
Stamme weisen die durch den Vektor codierte Resistenz auf und besitzen daruber 
hinaus ein aktives sacB-Gen. Durch ein zweites homologes Rekombinationsereignis 
(zweiter "Cross over"), soli nun die pHE55-DNA zusammen mit dem intakten Gen 
aus der genomischen DNA ausgegliedert werden. Durch dieses Rekombinations- 
ereignis entsteht ein Stamm, der nur noch uber das inaktivierte Gen verfugt. Daruber 
hinaus kommt es zum Verlust der pHE55-codierten Antibiotika-Resistenz und des 
sacB-Gens. Streicht man Stamme auf Saccharose-haltigen Medien aus, werden 
Stamme die das sacB-Gen exprimieren im Wachstum gehemmt, da das Genprodukt 
Saccharose zu einem Polymer umsetzt, welches im Periplasma der Zellen 
akkumuliert wird. Zellen, die durch das zweite Rekombinationsereignis das sacB- 
Gen nicht mehr tragen, werden somit nicht im Wachstum gehemmt. Urn eine 
phanotypische Selektionsmoglichkeit auf die Integration des durch Deletion inakti- 
vierten Gens zu besitzen, tauscht man dieses nicht gegen ein intaktes Gen aus, 
sondern man bedient sich eines Stammes, in dem das auszutauschende Gen bereits 
durch Insertion eines Q-Elements "markiert" vorliegt. Bei erfolgreichem Austausch 
verliert der resultierende Stamm die durch das Q-Element codierte Antibiotika- 
Resistenz. 



Das inaktivierte Gen fcsA wurden nach /Vl-Verdauung aus dem Plasmid pSK/csA 
isoliert und mit Pst\ geschnittener pHE55 DNA ligiert. Der Ligationsansatz wurde 
nach E. coli SI 7-1 transformiert. Die Selektion erfolgte auf Tetracyclin-haltigem LB- 
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Medium. Es wurden Tetracyclin-resistente Transformanden erhalten, deren Hybrid- 
plasmid (pHEfcsA) das inaktivierte Gen fcsA enthielt. 

Das inaktivierte Gen echA wurden nach £^oRI-Verdauung aus dem Plasmid 
5 pSKechA isoliert und mit Mung Bean Nuklease behandek (Erzeugung von glatten 

Enden ["blunt ends"]). Das Fragment wurde mit BamRl geschnittener und Mung 
Bean Nuklease behandelter pHE55 DNA ligiert. Der Ligationsansatz wurde nach E. 
coli SI 7-1 transformiert. Die Selektion erfolgte auf Tetracyclin-haltigem LB- 
Medium. Es wurden Tetracyclin-resistente Transformanden erhalten, deren 
1 0 Hybridplasmid (pHEec/?A) das inaktivierte Gen echA enthielt. 

Das inaktivierte Gen vdhA wurden nach £coRI-Verdauung aus dem Plasmid 
pSKv£#?A isoliert und mit Mung Bean Nuklease behandelt. Das Fragment wurde mit 
BamHl geschnittener und Mung Bean Nuklease behandelter pHE55 DNA ligiert. Der 
15 Ligationsansatz wurde nach E. coli SI 7-1 transformiert. Die Selektion erfolgte auf 

Tetracyclin-haltigem LB-Medium. Es wurden Tetracyclin-resistente Transformanden 
erhalten, deren Hybridplasmid (pHEvrffcA) das inaktivierte Gen vdhA enthielt. 

Das inaktivierte Gen aatA wurden nach £coRI-Verdauung aus dem Plasmid 
20 pSKaa/A isoliert und mit Mung Bean Nuklease behandelt. Das Fragment wurde mit 
BamHl geschnittener und Mung Bean Nuklease behandelter pHE55 DNA ligiert. Der 
Ligationsansatz wurde nach E. coli SI 7-1 transformiert. Die Selektion erfolgte auf 
Tetracyclin-haltigem LB-Medium. Es wurden Tetracyclin-resistente Transformanden 
erhalten, deren Hybridplasmid (pHE<M/A)das inaktivierte Gen aatA enthielt. 

25 
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Beispiel 6 

Erzeugung von Mutanten des Stammes Pseudomonas sp. HR199, bei denen 
spezifisch Gene des Eugenol-Katabolismuses durch Insertion eines Q-Elementes 
inaktiviert wurden. 

Der Stamm Pseudomonas sp. HR199 wurde als Rezipient in Konjugationsexperi- 
menten eingesetzt, bei denen Stamme von E. coli SI 7-1 als Donoren eingesetzt 
wurden, die die unten aufgefiihrten Hybridplasmide von pSUP202 enthielten. Die 
Transkonjuganten wurden auf Gluconat-haltigem Mineralmedium selektiert, welches 
das dem Q-Element entsprechende Antibiotikum enthielt. "Homogenote" (Austausch 
des intakten Gens gegen das durch Q-Element-lnsertion inaktivierte Gen durch 
doppeltes "Cross over") und "heterogenote" (Integration des Hybridplasmids in das 
Genom durch einfachen "Cross over") Transkonjuganten konnten anhand der durch 
pSUP202 codierten Tetracyclin-Resistenz unterschieden werden. 

Die Mutanten Pseudomonas sp. HR199 fcsQKm und Pseudomonas sp. HR199/csQ 
Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 
(pSUP/csQKm) bzw. E. coli SI 7-1 (pSUP/csQGm) erhalten. Der Austausch des 
intakten yes-Gens gegen das durch QKm bzw. QGm inaktivierte Gen (fcsQKm bzw. 
fcsQGm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanten Pseudomonas sp. HR199 echQKm und Pseudomonas sp. HR199 echQ. 
Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 
(pSUPecAQKm) bzw. E. coli SI 7-1 (pSUPec^QGm) erhalten. Der Austausch des 
intakten ech-Gens gegen das durch QKm bzw. QGm inaktivierte Gen (echQ.Km 
bzw. ec/zQGm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanten Pseudomonas sp. HR199 vdhQKm und Pseudomonas sp. HR199 vdh 
QGm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 
(pSUPwtaQKm) bzw. E. coli SI 7-1 (pSUPvrf/fQGm) erhalten. Der Austausch des 
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intakten vdh-Gens gegen das durch QKm bzw. QGm inaktivierte Gen (W/zQKm 
bzw. vdhQ.Gm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanten Pseudomonas sp. HR199 aatOKm und Pseudomonas sp. HR199 aa(Q 
5 Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. colt SI 7-1 

(pSUPaa/QKm) bzw. E. coli SI 7-1 (pSUPaa/QGm) erhalten. Der Austausch des 
intakten a^/-Gens gegen das durch QKm bzw. QGm inaktivierte Gen (aatQKm bzw. 
aa/QGm) wurde mittels DNA-Sequenzierung verifiziert. 

10 Die Mutante Pseudomonas sp. HR199 fcsQKmvdhQ.Gm wurden nach Konjugation 
von Pseudomonas sp. HR199 fcsQKm mit E. coli SI 7-1 (pSUPvJ/jQGm) erhalten. 
Der Austausch des intakten v£#z-Gens gegen das durch QGm inaktivierte Gen (vdhQ 
Gm) wurde mittels DNA-Sequenzierung verifiziert. 

15 Die Mutante Pseudomonas sp. HR199 vdhQKmaalQGm wurden nach Konjugation 
von Pseudomonas sp. HR199 vdhQKm mit E. coli SI 7-1 (pSUPaar/QGm) erhalten. 
Der Austausch des intakten aaf-Gens gegen das durch QGm inaktivierte Gen (aa/Q 
Gm) wurde mittels DNA-Sequenzierung verifiziert. 

20 Die Mutante Pseudomonas sp. HR199 vdhQiimechnGm wurden nach Konjugation 
von Pseudomonas sp. HR199 vdhQKm mit E. coli SI 7-1 (pSUP<?c/?QGm) erhalten. 
Der Austausch des intakten ec/z-Gens gegen das durch QGm inaktivierte Gen (echQ. 
Gm) wurde mittels DNA-Sequenzierung verifiziert. 
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Bcispiel 7 

Erzeugung von Mutanten des Stammes Pseudomonas sp. HR199, bci denen 
spezifisch Gene des Eugenol-Katabolismuses durch Deletion eines Teilbereiches 
5 inaktiviert wurden. 

Die Stamme Pseudomonas sp. HR199 fcsQYJxi, Pseudomonas sp. HR199 echDKxn, 
Pseudomonas sp. HR199 vdhQKm und Pseudomonas sp. HR199 aatQKm wurden 
als Rezipient in Konjugationsexperimenten eingesetzt, bei denen Stamme von E. coli 
SI 7-1 als Donoren eingesetzt wurden, die die unten aufgefuhrten Hybridplasmide 

10 von pHE55 enthielten. Die "heterogenoten" Transkonjuganten wurden auf Gluconat- 
haltigem Mineralmedium selektiert, welches neben Tetracyclin (pHE55 codierte 
Resistenz) das dem Q-Element entsprechende Antibiotikum enthielt. Nach Ausstrei- 
chen auf Saccharose-haltigem Mineralmedium wurden Transkonjuganten erhalten, 
die durch ein zweites Rekombinationsereignis (zweiter "Cross over") die Vektor- 

15 DNA eliminiert hatten. Durch Ausstreichen auf Mineralmedium ohne Antibiotika 

bzw. mit dem Q-Element entsprechenden Antibiotikum konnten die Mutanten 
erkannt werden, bei denen das durch Q-Element inaktivierte Gen gegen das durch 
Deletion inaktivierte Gen ausgetauscht worden war (keine Antibiotika-Resistenz). 

20 Die Mutante Pseudomonas sp. HR199 fcsA wurde nach {Conjugation von Pseudomo- 
nas sp. HR199 fcsQKm mit E. coli SI 7-1 (pHEfcsA) erhalten. Der Austausch des 
durch QKm inaktivierten Gens (fcsQKm) gegen das durch Deletion inaktivierte Gen 
(fcsA) wurde mittels DNA-Sequenzierung verifiziert. 

25 Die Mutanten Pseudomonas sp. HR199 echA wurde nach {Conjugation von Pseudo- 

monas sp. HR199 echQKm mit £". coli SI 7-1 (pHEechA) erhalten. Der Austausch 
des durch QfCm inaktivierten Gens (echQKm) gegen das durch Deletion inaktivierte 
Gen {echA) wurde mittels DNA-Sequenzierung verifiziert. 
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Die Mutanten Pseudomonas sp. HR199 vdhA wurde nach Konjugation von Pseu- 
domonas sp. HR199 vdhQKm mit E. coli SI 7-1 (pHEvdhA) erhalten. Der Austausch 
des durch QKm inaktivierten Gens (v^QKm) gegen das durch Deletion inaktivierte 
Gen (vdhA) wurde mittels DNA-Sequenzierung verifiziert. 

5 

Die Mutanten Pseudomonas sp. HR199 aatA wurde nach Konjugation von Pseudo- 
monas sp. HR199 aatQKm mit E. coli Si 7-1 (pHEaatA) erhalten. Der Austausch des 
durch QKm inaktivierten Gens (aatQKm) gegen das durch Deletion inaktivierte Gen 
(aatA) wurde mittels DNA-Sequenzierung verifiziert. 

10 

Beispiel 8 

Biotransformation von Eugenol zu Vanillin mit der Mutante Pseudomonas sp. 
HR199 vdhQKm. 

15 Der Stamm Pseudomonas sp. HR199 vdhQKm wurde in 50 ml HR-MM mit 6 mM 

Eugenol bis zu einer optischen Dichte von ca. OD600nm = 0.6 angezogen. Nach 17 h 
waren 2.9 mM Vanillin, 1.4 mM Ferulasaure und 0.4 mM Vanillinsaure im Kultur- 
iiberstand nachweisbar. 

20 Beispiel 9 

Biotransformation von Eugenol zu Ferulasaure mit der Mutante Pseudomonas 
sp. HR199 vrf/ifiGmflff/QKm. 

Der Stamm Pseudomonas sp. HR199 vdhQGmaatQKm wurde in 50 ml HR-MM mit 
25 6 mM Eugenol bis zu einer optischen Dichte von ca. OD600nm = 0.6 angezogen. 

Nach 18 h waren 1.9 mM Vanillin, 2.4 mM Ferulasaure und 0.6 mM Vanillinsaure 
im Kulturiiberstand nachweisbar. 
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Beispiel 10 

Biotransformation von Eugenol zu Coniferylalkohol mit der Mutante Pseudo- 
monas sp. HR199 vdhClGmaatOKm. 

5 Der Stamm Pseudomonas sp. HR199 vdhQGmaatQKxn wurde in 50 ml HR-MM mit 
6 mM Eugenol bis zu einer optischen Dichte von ca. OD600nm = 0.4 angezogen. 
Nach 15 h waren 1.7 mM Coniferylalkohol, 1.4 mM Vanillin, 1.4 mM Ferulasaure 
und 0.2 mM Vaniilinsaure im Kulturuberstand nachweisbar. 

10 Beispiel 11 

Fermentative Produktion von naturlichem Vanillin aus Eugenol im 10 1 
Fermenter mit der Mutante Pseudomonas sp. HR 199 vdhQKm. 

Mit 100 ml einer 24 Stunden alten Vorkultur, die auf einer Schuttelmaschine (120 
15 Upm) bei 32°C in einem auf pH 7,0 eingestellten Medium aus 12,5 g/1 Glyzerin, 
10 g/1 Hefeextrakt und 0,37 g/I Essigsaure angezogen wurde, wurde der Produktions- 
fermenter beimpft. Der Fermenter enthielt 9,9 1 Medium mit folgender Zusammen- 
setzung: 1,5 g/1 Hefeextrakt, 1,6 g/1 KH 2 P0 4 , 0,2 g/1 NaCl, 0,2 g/1 MgS0 4 . Der pH- 
Wert wurde mit Natronlauge auf pH 7,0 eingestellt. Nach der Sterilisation wurde 
20 dem Medium 4 g Eugenol zugefiigt. Die Temperatur betrug 32°C, die Beluftung 3 
Nl/min und die Ruhrerdrehzahl 600 Upm. Der pH-Wert wurde mit Natronlauge bei 
pH 6,5 gehalten. 

Vier Stunden nach dem Animpfen wurde mit der kontinuierlichen Zugabe von 
25 Eugenol begonnen, so dali am Ende der Fermentation nach 65 Stunden 255 g Euge- 

nol zur Kultur gegeben worden waren. AuBerdem wurden wahrend der Fermentation 
40 g Hefeextrakt zugeftittert. Die Konzentration an Eugenol lag am Ende der Fer- 
mentation bei 0,2 g/I. Der Gehalt an Vanillin betrug 2,6 g/1. Zusatzlich lagen noch 
3,4 g/1 Ferulasaure vor. 
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Das so erhaltene Vanillin kann durch bekannte physikalische Verfahren wie Chro- 
matographic Destination und/oder Extraktion isoliert und zur Herstellung naturlicher 
Aromen verwendet werden. 

5 Erlauterungen zu den Figuren: 

FIG. la bis lr: 

Gen- Strukturen zur Gewinnung von Organismen und Mutanten 

10 

calA *: Teil des inaktivierten Gens der Coniferylalkohol-Dehydrogenase 
calB*: Teil des inaktivierten Gens der Coniferylaldehyd-Dehydrogenase 
fcs*: Teil des inaktivierten Gens der Ferulasaure-CoA Synthetase 
ech*; Teil des inaktivierten Gens der Enoyl-CoA Hydratase- Aldolase 
1 5 vdh*: Teil des inaktivierten Gens der Vanillin-Dehydrogenase 

aat*\ Teil des inaktivierten Gens der beta-Ketothiolase 

Die mit versehenen Restriktionsenzym-Schnittstellen kamen fur die Konstruktion 
zum Einsatz, sind jedoch in dem resultierenden Konstrukt nicht mehr funktionsfahig. 

20 
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FIG. 2a: Nukleotidsequenz der Gen-Struktur calAQKm 
FIG. 2b: Nukleotidsequenz der Gen-Struktur calAOGm: 
FIG. 2c: Nukleotidsequenz der Gen-Struktur calAA 
FIG. 2d: Nukleotidsequenz der Gen-Struktur calBQKm 
FIG. 2e: Nukleotidsequenz der Gen-Struktur calBCIGm 
FIG. 2f: Nukleotidsequenz der Gen-Struktur calBA 
FIG. 2g: Nukleotidsequenz der Gen-Struktur fcsQKm 
FIG. 2h: Nukleotidsequenz der Gen-Struktur fcsQGm 
FIG. 2i: Nukleotidsequenz der Gen-Struktur fcs& 
FIG. 2j: Nukleotidsequenz der Gen-Struktur echQKm 
FIG. 2k: Nukleotidsequenz der Gen-Struktur echQGm 
FIG. 21: Nukleotidsequenz der Gen-Struktur echA 
FIG. 2m: Nukleotidsequenz der Gen-Struktur vdhQKm 
FIG. 2n: Nukleotidsequenz der Gen-Struktur vdhClGm 
FIG. 2o: Nukleotidsequenz der Gen-Struktur vdhA 
FIG. 2p: Nukleotidsequenz der Gen-Struktur aatQKm 
FIG. 2q: Nukleotidsequenz der Gen-Struktur ctatQGm 
FIG. 2r: Nukleotidsequenz der Gen-Struktur aath 
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Patentanspruche 

1 . Transformierter und/oder mutagenisierter ein- oder mehrzelliger Organismus, 
der dadurch gekennzeichnet ist, daB Enzyme des Eugenol- und/oder Ferula- 
saure-KataboIismus derart inaktiviert sind, daB eine Akkumulation der 
Intermediate Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin 
und/oder Vanillinsaure erfolgt. 

2. Organismus nach Anspruch 1 5 dadurch gekennzeichnet, daB der Eugenol- 
und/oder Ferulasaure-Katabolismus durch Q-Element-Insertion oder Einfuh- 
ren von Deletionen in entsprechende Gene verandert ist. 

3. Organismus nach einem der AnsprQche 1 oder 2, dadurch gekennzeichnet, 
daB ein oder mehrere Gene, die fur die Enzyme Coniferylalkohol-Dehydro- 
genasen, Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA Synthetasen, 
Enoyl-CoA Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydro- 
genasen oder Vanillinsaure-Demethylasen Enzyme kodieren, verandert 
und/oder inaktiviert sind. 

4. Organismus nach einem der AnsprQche 1 bis 3, dadurch gekennzeichnet, daB 
er einzellig, vorzugsweise ein Mikroorganismus oder eine pflanzliche oder 
eine tierische Zelle ist. 

5. Organismus nach einem der AnsprQche 1 bis 4, dadurch gekennzeichnet, daB 
er ein Bakterium, vorzugsweise eine Pseudomonas- Art ist. 

6. Gen-Strukturen, bei denen die fur die Enzyme Coniferylalkohol-Dehydroge- 
nasen, Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA Synthetasen, 
Enoyl-CoA Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydroge- 
nasen oderVanillinsaure-Demethylasen oder zweier oder mehrerer dieser En- 
zyme kodierenden Nukleotidsequenzen verandert und/oder inaktiviert sind. 
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7. Gen-Strukturen mit den in Figur la bis Ir angegebenen Strukturen. 

8. Gen-Strukturen mit den in Figur 2a bis 2r angegebenen Sequenzen. 

9. Vektoren enthaltend wenigstens eine Gen-Struktur nach einem der Anspriiche 
6 bis 8. 



10. Transformierter Organismus nach einem der Anspriiche 1 bis 5, dadurch 
1 0 gekennzeichnet, daB er wenigstens einen Vektor gemaB Anspruch 9 enthalt. 

1 1. Organismus nach einem der Anspriiche 1 bis 5, dadurch gekennzeichnet, daB 
er wenigstens eine Gen-Struktur nach einem der Anspriiche 6 bis 8 an Stelle 
des jeweiligen intakten Gens im Genom integriert enthalt. 



15 



20 



25 



12. Verfahren zur biotechnischen Herstellung von organischen Verbindungen, 
insbesondere von Alkoholen, Aldehyden und organischen Sauren, dadurch 
gekennzeichnet, daB ein Organismus nach einem der Anspriiche 1 bis 5 oder 
1 0 bis 1 1 eingesetzt wird. 

13. Verfahren zur Herstellung der Organism en nach einem der Anspriiche 1 bis 5, 
dadurch gekennzeichnet, daB die Veranderung des Eugenol- und/oder Ferula- 
saure-Katabolismus mittels an sich bekannter mikrobiologischer Zuchtungs- 
methoden erzielt wird. 

14. Verfahren zur Herstellung eines Organismus nach einem der Anspriiche 1 bis 
5 oder 10 bis 1 1, dadurch gekennzeichnet, daB die Veranderung des Eugenol- 
und/oder Ferulasaure-Katabolismus und/oder die Inaktivierung der entspre- 
chenden Gene mittels gentechnischer Methoden erzielt wird. 
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15. Verwendung der Organismen nach einem der Anspruche 1 bis 5 oder 10 bis 
1 1 zur Herstellung von Coniferylalkohol, Coniferylaldehyd, Ferulasaure, 
Vanillin und/oder Vanillinsaure. 

5 16. Verwendung von Gen-Strukturen nach einem der Anspruche 6 bis 8 oder 

eines Vektors nach Anspruch 9 zur Herstellung transformierter und/oder 
mutagenisierter Organismen. 
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calAQKm 
Fig. 1a 

calAQGm 




Fig. 1b 



Psfl SMVBal 31 Psfl 




Deletion von 539 bp 

Fig. 1c 



EcoRI 



fig/llVBal 31 Smal* 



Smal* BgfllVBal 31 



ca/BQKm 



^ca/e^^^^^^ f ^InKm-Element j^iii 




EcoRI 



^ca/B*^ 



Fig. 1d 



EcoRI 



ca/BQGm 
Fig. 1e 



BaAlVBal 31 Smal" 



S/7?ai* BgJ\\*/Ba\ 31 




EcoRI 



EcoRI 



egrtlVBa! 31 



EcoRI 



calBA 



Fig. 1f 




Deletion von 586 bp 
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fcsQKm 
Fig. ig 

fcsQGm 
Fig. 1h 

fcsA 
Fig. 1 i 



Psfl 



Psfl 



BssHII* Sma\ 



Smar BssHII* 



: -v;KaKm-Element ; 





BssH\\*Sma\* 

V 



Smar BssHir 



BssHII 



Deletion von 1 290 bp 



Psfl 




Psfl 




ecftQKm 
Fig. 1j 



EcoRl 




^f^nKm-Eiement' 




EcoRl 



Fig. 1k 



EcoRl 



NrurSmar 



Smar Nrur 




EcoRl 



echA 



Fig. 11 



EcoRl 



Nru\ 



Deletion von 483 bp 



EcoRl 
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Fig. 1m 



EcoRI 



B$sH\\*Sma\* 



Smal* BssHW* 



vdhQGm 




EcoRI 



Fig. 1n 



EcoRI BssHW EcoRI 



vdhA 




Deletion von 210 bp 

Fig. 1o 



EcoRI 



BssHW* Smal* 



Sma\* BssHW" 



aatQKm 




EcoRI 



Fig. 1p 



EcoRI 



aa/QGm 



BssHII'Smal* 
V 



Sma\* BssHW* 



EcoRI 



Fig. 1q 



EcoRI SssHII EcoRI 



aatA 




Deletion von 59 bp 



Fig. 1 r 
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Seguenzen 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC 4 72 

Met Gin Leu Thr Asn Lys Lys lie Val Val Thr Gly Val Ser Ser 
1 5 10-15 

GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
Gly He Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr 
20 25 30 

GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568 
Val He Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 

GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GAT AAG GCC ATC GGG 616 
Val Gin Ala Asp Leu Ser His Pro Glu Gly He Asp Lys Ala He 
50 55 60 62 

ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC 67 6 

AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT 736 

GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC 7 90 

Met He Glu Gin Asp Gly Leu His 
1 5 

GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG 8 38 

Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp 
10 15 20 

GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA 88 6 

Ala Gin Gin Thr He Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser 
25 30 35 40 

GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC 934 
Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala 
45 50 55 

CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG 982 
Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr 
60 65 70 



WO 00/26355 PCT/EP99/07952 



ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA 1030 
Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly 
75 80 85 

AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA 107 8 

Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser 
90 95 100 

TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG 112 6 

Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met Ala Asp Ala Met 
105 110 115 120 

CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA 117 4 

Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin 
125 130 135 

GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT 1222 
Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu 
140 145 150 

GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC 1270 
Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala 
155 160 165 

GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC 1318 
Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu 
170 175 180 

GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT 1366 
Val Val Thr His Gly Asp Ala Cys Leu Pro Asn He Met Val Glu Asn 
185 190 195 200 

GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC 1414 
Gly Arg Phe Ser Gly Phe He Asp Cys Gly Arg Leu Gly Val Ala Asp 
205 210 215 

CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT 14 62 

Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He Ala Glu Glu Leu 
220 225 230 

GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT 1510 
Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala Ala 
235 240 245 

CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC 1558 
Pro Asp Ser Gin Arg He Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 
250 255 260 264 

TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCTG GCC GCG GTG 1613 

Ala Ala Val 
225 

ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT 1661 
He Ala Phe Met Cys Ala Glu Glu Ser Arg Trp He Asn Gly He Asn 
230 235 240 
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ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 1710 
lie Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val 
245 250 255 

GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 1770 

GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 1830 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 18 90 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 1950 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 2010 

CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 2070 

ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 2130 

TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 2164 

FIG . 2a: 
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CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC 4 72 
Met Gin Leu Thr Asn Lys Lys He Val Val Thr Gly Val Ser Ser 
15 10 15 

GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
Gly He Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr 
20 25 30 



GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568 
Val He Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 

GTT CAG GCT GAC CTG AGC CAT CCT GAGGGGAGAG GCGGTTTGCG TATTGGGCGC 622 
Val Gin Ala Asp Leu Ser His Pro 
50 55 

ATGCATAAAA ACTGTTGTAA T T CAT T AAG C ATTCTGCCGA CATGGAAGCC ATCACAAACG 682 

GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG 74 2 

CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT 802 

CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA 8 62 

CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT 922 

TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT 982 

TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG 1033 

Met Leu Arg Ser Ser Asn Asp Val Thr Gin 
15 10 



CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC 1081 

Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly Ser Ser Met Gly He 

15 20 25 

ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT 1129 

He Arg Thr Cys Arg Leu Gly Pro Asp Gin Val Lys Ser Met Arg Ala 

30 35 40 



GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC 
Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser 
45 50 55 
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CAA CAT CAG CCG GAC TCC GAT TAG CTC GGG AAC TTG CTC CGT AGT AAG 1225 
Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys 
60 65 70 

ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT 127 3 

Thr Phe lie Ala Leu Ala Ala Phe Asp Gin Glu Ala Val Val Gly Ala 
75 80 85 90 

CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC 1321 
Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin Pro Arg Ser Glu He 
95 100 105 

TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT 136 9 

Tyr He Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gin Gly He 
110 115 120 

GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT 14 17 

Ala Thr Ala Leu He Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly 
125 130 135 

GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG 14 65 

Ala Tyr Val He Tyr Val Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val 
140 145 150 

GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT 1513 
Ala Leu Tyr Thr Lys Leu Gly He Arg Glu Glu Val Met His Phe Asp 
155 160 165 170 

ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCT 1567 
He Asp Pro Ser Thr Ala Thr 
175 177 

G ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT 1616 
He Ala Phe Met Cys Ala Glu Glu Ser Arg Trp He Asn Gly He Asn 
228 230 235 240 

ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 1665 
He Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val 
245 250 255 

GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 1725 

GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 1785 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 18 4 5 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 1905 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 1965 

CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 202 5 

ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 2085 

TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 2119 



FIG . 2b: 
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CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TG AT TAG AG A CATTAACTAT TTTGGCGGAA 3 60 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC 4 72 
Met Gin Leu Thr Asn Lys Lys lie Val Val Thr Gly Val Ser Ser 
15 10 15 

GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
Gly lie Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr 
20 25 30 

GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 5 68 
Val lie Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 

GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GATC AAC GGC ATA AAT 617 
Val Gin Ala Asp Leu Ser His Pro Glu Gly lie Asn Gly lie Asn 
50 55 58 240 

ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 666 
He Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val 
245 250 255 

GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 726 

GAGGTAGCGG GCGGAAAGGT G CAG AAT GTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 786 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GG AAT GAT AT GAAAGCAAGT AGATCAGTCT 84 6 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 906 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 966 

CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 1026 

ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA. TCGTAACTTT GACCGGGGGC 108 6 

TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 1120 
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GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG 521 
Gly Ala Pro Val Gly Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 
10 15 20 

AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG 569 
Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 

AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA 617 
Ser Arg Leu Asp Arg Ala lie Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 

ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA 665 
lie Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 
60 65 70 

ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 
Thr Leu Leu Cys Asp lie Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 

CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 7 61 

Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 

TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 809 
Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
105 110 115 

GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 857 
Gly Val lie Ser Pro Trp Asn Phe Pro He Val Leu Ala Phe Gly Pro 
120 125 130 135 

CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC 905 
Leu Ala Gly He Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 
140 145 150 

GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT 953 
Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu lie Ala Arg 
155 160 165 
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TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 1001 
Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 

GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 10 4 9 

Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu He Phe Thr Gly 
185 190 195 

GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 
Gly Thr Ala Val Ala Lys His He Met Arg Ala Ala Ala Asp Asn Leu 
200 205 210 215 

GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 114 5 

Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val He Val Ser 
220 225 230 

CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 
Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 
235 240 245 

ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG CTG 124 1 

Thr Phe Asn Ala Gly Gin He Cys Leu Ala Pro Asp Tyr Val Leu Leu 
250 255 260 

CCG GAA GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT 12 97 
Pro Glu 
265 

TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 1357 

GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA 1412 

Met He Glu Gin 
1 

GAT GGA TTG CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC 14 60 

Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe 
5 10 15 20 

GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG 1508 
Gly Tyr Asp Trp Ala Gin Gin Thr He Gly Cys Ser Asp Ala Ala Val 
25 30 35 

TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC 15 5 6 

Phe Arg Leu Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp 
40 45 50 

CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG 1604 
Leu Ser Gly Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser 
55 60 65 

TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC 1652 
Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val 
70 75 80 
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ACT GAA GCG GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG 17 00 

Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin 
85 90 95 100 

GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG 174 8 

Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met 
105 110 115 

GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA 17 96 

Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro 
120 125 130 

TTC GAC CAC CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG 184 4 

Phe Asp His Gin Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met 
135 1^0 145 

GAA GCC GGT CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG 1892 
Glu Ala Gly Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly 
150 155 160 

CTC GCG CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC 194 0 

Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 
165 170 175 180 

GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC 198 8 

Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn He 
185 190 195 

ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG 2036 
Met Val Glu Asn Gly Arg Phe Ser Gly Phe He Asp Cys Gly Arg Leu 
200 205 210 

GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT 2084 
Gly Val Ala Asp Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He 
215 220 225 

GCT GAA GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC 2132 
Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr 
230 235 240 

GGT ATC GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT 2180 
Gly He Ala Ala Pro Asp Ser Gin Arg He Ala Phe Tyr Arg Leu Leu 
245 250 255 260 

GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 2235 
Asp Glu Phe Phe 
264 

CGC CAT GCC AAG CCT GTT CTC GTG CAA AGT CCT GTG GGT GAG TCG AAC 228 3 

His Ala Lys Pro Val Leu Val Gin Ser Pro Val Gly Glu Ser Asn 
444 445 450 455 

TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 2331 
Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala He His Gly Leu Leu Ser 
460 465 470 
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GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 2 38 5 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 24 4 5 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 2505 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 2565 

CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 2 625 

CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 2 685 

ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 27 4 5 

TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 2 805 

CCAACCTTGA GG-AATTC 2822 
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GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG 521 
Gly Ala Pro Val Gly Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 
10 15 20 

AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG 5 69 

Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 

AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA 617 
Ser Arg Leu Asp Arg Ala lie Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 

ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA 665 
lie Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 
60 65 70 

ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 
Thr Leu Leu Cys Asp lie Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 

CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 7 61 

Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 

TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 809 
Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
105 110 115 

GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 8 57 

Gly Val lie Ser Pro Trp Asn Phe Pro lie Val Leu Ala Phe Gly Pro 
120 125 130 135 

CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC 905 
Leu Ala Gly lie Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 
140 145 150 



GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT 
Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu lie Ala Arg 
155 160 165 
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TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 1001 
Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 

GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 104 9 

Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu lie Phe Thr Gly 
185 190 195 

GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 
Gly Thr Ala Val Ala Lys His lie Met Arg Ala Ala Ala Asp Asn Leu 
200 205 210 215 

GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 114 5 

Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val He Val Ser 
220 225 230 

CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 
Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 
235 240 245 

ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG GGG 1241 
Thr Phe Asn Ala Gly Gin He Cys Leu Ala Pro Asp Tyr Val Leu 
250 255 260 262 

GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT 1301 

GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC 1361 

CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA 14 21 

CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC 14 81 

T C ACG C AAC T GGTCCAGAAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT 1541 

TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA 1601 

GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC 1656 

Met Leu Arg 
1 

AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA 1704 
Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu 
5 10 15 

GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC 17 52 

Gly Gly Ser Ser Met Gly He He Arg Thr Cys Arg Leu Gly Pro Asp 
20 25 30 35 

CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC 1800 
Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe 
40 45 50 

GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC 184 8 

Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu 
55 60 65 

GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC 18 96 

Gly Asn Leu Leu Arg Ser Lys Thr Phe lie Ala Leu Ala Ala Phe Asp 
70 75 80 
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CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT 194 4 

Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe 
85 90 95 

GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC 1992 
Glu Gin Pro Arg Ser Glu lie Tyr lie Tyr Asp Leu Ala Val Ser Gly 
100 105 110 115 

GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG 204 0 

Glu His Arg Arg Gin Gly lie Ala Thr Ala Leu lie Asn Leu Leu Lys 
120 125 130 

CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT 2088 
His Glu Ala Asn Ala Leu Gly Ala Tyr Val lie Tyr Val Gin Ala Asp 
135 140 145 

TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG 2136 
Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly lie Arg 
150 155 160 

GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA 218 4 

Glu Glu Val Met His Phe Asp lie Asp Pro Ser Thr Ala Thr 
165 170 175 177 

TTCGTTCAAG CCGAGATCGG CTTCCCTG CAA AGT CCT GTG GGT GAG TCG AAC 2236 

Gin Ser Pro Val Gly Glu Ser Asn 
451 455 

TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 22 84 

Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala lie His Gly Leu Leu Ser 
460 465 470 

GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 2338 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 2398 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 24 58 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 2518 

CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 257 8 

CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 2638 

ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 2 698 

TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 27 58 

CCAACCTTGA GGAATTC 27 7 5 
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GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CG ATG AGC ATT CTT GGT TTG AAT 4 73 

Met Ser lie Leu Gly Leu Asn 

1 5 

GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG 521 

Gly Ala Pro Val Gly Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 

10 15 20 

AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG 569 
Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 

AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA 617 
Ser Arg Leu Asp Arg Ala lie Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 

ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA 665 
lie Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 
60 65 70 

ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 
Thr Leu Leu Cys Asp lie Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 

CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 7 61 

Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 

TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 809 
Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
105 110 115 

GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 857 
Gly Val lie Ser Pro Trp Asn Phe Pro lie Val Leu Ala Phe Gly Pro 
120 125 130 135 

CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC 905 
Leu Ala Gly lie Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 
140 145 150 



GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT 
Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu lie Ala Arg 
155 160 165 
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TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 1001 
Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 

GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 104 9 

Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu lie Phe Thr Gly 
185 190 195 

GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 
Gly Thr Ala Val Ala Lys His He Met Arg Ala* Ala Ala Asp Asn Leu 
200 205 210 215 

GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 114 5 

Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val He Val Ser 
220 225 230 

CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 
Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 
235 240 245 

ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CC GTG GGT GAG TCG AAC 124 0 

Thr Phe Asn Ala Gly Gin He Cys Leu Ala Val Gly Glu Ser Asn 
250 255 257 454 455 

TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 128 8 

Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala He His Gly Leu Leu Ser 
460 465 470 

GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 134 2 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 14 02 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 14 62 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CG ATG ACT AT TTTGCCTCTT 1522 

CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 1582 

CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 164 2 

ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 1702 

TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 17 62 

CCAACCTTGA GGAATTC 17 7 9 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC AT CAT CAT GC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356 

Met Arg Ser Leu Glu 
1 5 

GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG 4 04 

Ala Leu Leu Pro Phe Pro Gly Arg lie Leu Glu Arg Leu Glu His Trp 
10 15 20 

GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 4 52 

Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 
25 30 35 

GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 
Gly Glu Trp Arg Arg lie Ser Tyr Ala Glu Met Phe His Asn Val Arg 
40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 54 8 

Ala lie Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 
55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 
Leu Leu lie Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 
70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly lie Pro Tyr Cys Pro Val Ser Pro Ala Tyr 
90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 
Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His lie Val Gly Leu 
105 110 115 

CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG 740 
Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin 
120 125 130 132 

ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC 800 

AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT 8 60 

GAT C AAG AG A CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC 914 

Met lie Glu Gin Asp Gly Leu His 
1 5 



GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG 
Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp 
10 15 20 



962 
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GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA 1010 
Ala Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser 
25 30 35 40 

GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC 1058 
Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala 
45 50 55 

CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG 1106 
Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr 
60 65 70 

ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA 1154 
Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly 
75 80 85 

AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA 1202 
Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser 
90 ' 95 100 

TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG 1250 
Ser His Leu Ala Pro Ala Glu Lys Val Ser He Met Ala Asp Ala Met 
105 HO 115 120 

CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA 12 98 

Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin 
125 130 135 

GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT 134 6 

Ala Lys His Arg He Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu 
140 145 150 

GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC 1394 
Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala 
155 160 165 

GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC 14 4 2 

Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu 
170 175 180 

GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT 14 90 

Val Val Thr His Gly Asp Ala Cys Leu Pro Asn He Met Val Glu Asn 
185 190 195 200 

GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC 1538 
Gly Arg Phe Ser Gly Phe He Asp Cys Gly Arg Leu Gly Val Ala Asp 
205 210 215 

CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT 158 6 

Arg Tyr Gin Asp lie Ala Leu Ala Thr Arg Asp He Ala Glu Glu Leu 
220 225 230 

GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT 1634 
Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala Ala 
235 240 245 
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CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC 1682 
Pro Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 
250 255 260 264 

TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCCT GTT TTG CAA 17 37 

Val Leu Gin 
563 565 

TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC 178 5 

Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly Glu Asp Gin Ser 
570 575 580 

ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC 18 32 

Met Leu Arg Asp Glu Ala Thr Leu 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 240 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356 

Met Arg Ser Leu Glu 
1 5 

GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG 4 04 

Ala Leu Leu Pro Phe Pro Gly Arg He Leu Glu Arg Leu Glu His Trp 
10 15 20 

GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 4 52 

Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 
25 30 35 

GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 
Gly Glu Trp Arg Arg He Ser Tyr Ala Glu Met Phe His Asn Val Arg 
40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 54 8 

Ala He Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 
55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 
Leu Leu He Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 
70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly He Pro Tyr Cys Pro Val Ser Pro Ala Tyr 
90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 
Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His He Val Gly Leu 
105 110 115 

CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG 7 40 

Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin 
120 125 130 132 

GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT 800 

GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC 8 60 

CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA 920 

CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC 980 

TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT 104 0 

TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA 1100 
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GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC 1155 

Met Leu Arg 
1 

AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA 1203 
Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu 
5 10 15 

GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC 1251 
Gly Gly Ser Ser Met Gly lie He Arg Thr Cys Arg Leu Gly Pro Asp 
20 25 30 35 

CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC 12 99 

Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe 
40 45 50 

GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC 134 7 

Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu 
55 60 65 

GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC 1395 
Gly Asn Leu Leu Arg Ser Lys Thr Phe He Ala Leu Ala Ala Phe Asp 
70 "75 80 

CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT 14 4 3 

Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe 
85 90 95 

GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC 14 91 

Glu Gin Pro Arg Ser Glu He Tyr He Tyr Asp Leu Ala Val Ser Gly 
100 105 110 115 

GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG 1539 
Glu His Arg Arg Gin Gly He Ala Thr Ala Leu He Asn Leu Leu Lys 
120 125 130 

CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT 1587 
His Glu Ala Asn Ala Leu Gly Ala Tyr Val lie Tyr Val Gin Ala Asp 
135 140 145 

TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG 1635 
Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly He Arg 
150 155 160 

GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA 168 3 

Glu Glu Val Met His Phe Asp He Asp Pro Ser Thr Ala Thr 
165 170 175 177 

TTCGTTCAAG CCGAGATCGG CTTCCCCT GTT TTG CAA TGG CGG TCG GCG AAA 173 5 

Val Leu Gin Trp Arg Ser Ala Lys 
563 565 570 

GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC ATG CTG CGT GAC GAG 178 3 

Val Asp Ala Leu Tyr Arg Gly Glu Asp Gin Ser Met Leu Arg Asp Glu 
575 580 585 
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GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 1835 
Ala Thr Leu 
589 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 1895 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 1955 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 2015 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 207 5 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 2135 

AGGCGCTGAT CACGTGCTGT GTGTCGCGGG CTGCAG 2171 
FIG . 2h: 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AG AG T AC AG T GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATC AT CAT GC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356 

Met Arg Ser Leu Glu 
1 5 

GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG 4 04 

Ala Leu Leu Pro Phe Pro Gly Arg lie Leu Glu Arg Leu Glu His Trp 
10 15 20 

GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 4 52 

Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 
25 30 35 

GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 
Gly Glu Trp Arg Arg lie Ser Tyr Ala Glu Met Phe His Asn Val Arg 
40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 54 8 

Ala lie Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 
55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 
Leu Leu He Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 
70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly He Pro Tyr Cys Pro Val Ser Pro Ala Tyr 
90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 
Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His He Val Gly Leu 
105 HO 115 

CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG CGC 74 0 

Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin Arg 
120 125 130 133 

GCT GTT TTG CAA TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT 7 88 

Ala Val Leu Gin Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly 
562 565 570 575 

GAA GAT CAA TCC ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG 837 

Glu Asp Gin Ser Met Leu Arg Asp Glu Ala Thr Leu 

580 585 589 

GGGGGCTTAC TCGGCGTTTT CCGACACTGC GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT 8 97 



TGATTGCGGG GGTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGTCGCTCG 957 
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CGAAGTTCTG ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC 1017 

TATGGCTCAA GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG 1077 

TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT 1137 

GCTTCGGCAG GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG 1197 

CTGCAG 1203 
FIG. 2i: 
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GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGC AG TAG CT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 2 90 

Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
15 10 

GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 
Val Glu Glu Gly lie Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 
15 20 25 30 

AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 
35 40 45 

GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 

GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 70 75 

ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGACAGC 531 
Thr Asp Ala Gly Pro Glu lie Leu Gin Glu Lys lie Arg 
80 85 90 91 

AAGCGAACCG GAATTGCCAG CTGGGGCGCC CTCTGGTAAG GTTGGGAAGC CCTGCAAAGT 5 91 

AAACTGGATG GCTTTCTTGC CGCCAAGGAT CTGATGGCGC AGGGGATCAA GATCTGATCA 651 

AGAGACAGGA TGAGGATCGT TTCGC ATG ATT GAA CAA GAT GGA TTG CAC GCA 7 03 

Met lie Glu Gin Asp Gly Leu His Ala 
1 5 

GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG GCA 751 

Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp Ala 

10 15 20 25 

CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA GCG 7 99 

Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser Ala 
30 35 40 

CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC CTG 84 7 

Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala Leu 
45 50 55 

AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG ACG 895 
Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr Thr 
60 65 70 



WO 00/26355 PCT/EP99/07952 

25 



GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA AGG 94 3 

Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly Arg 
75 80 85 

GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA TCT 991 
Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser Ser 
90 95 100 105 

CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG CGG 1039 
His Leu Ala Pro Ala Glu Lys Val Ser lie Met Ala Asp Ala Met Arg 
110 115 120 

CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA GCG 108 7 

Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin Ala 
125 130 135 

AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT GTC 1135 
Lys His Arg lie Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu Val 
140 145 150 

GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC GAA 118 3 

Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala Glu 
155 160 165 

CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC GTC 1231 
Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu Val 
170 175 180 185 

GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT GGC 127 9 

Val Thr His Gly Asp Ala Cys Leu Pro Asn lie Met Val Glu Asn Gly 
190 195 200 

CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC CGC 1327 
Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu Gly Val Ala Asp Arg 
205 210 215 

TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT GGC 137 5 

Tyr Gin Asp lie Ala Leu Ala Thr Arg Asp lie Ala Glu Glu Leu Gly 
220 225 230 

GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT CCC 14 2 3 

Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly lie Ala Ala Pro 
235 240 245 

GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC TGA 14 71 

Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 
250 255 260 264 

GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC CC GAG CAG GGC ATG 152 5 

Glu Gin Gly Met 
255 

AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG ACC TAC 157 3 

Lys Gin Phe Leu Asp Glu Lys Ser lie Lys Pro Gly Leu Gin Thr Tyr 
260 265 270 
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AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA TAATGACAAT 1632 
Lys Arg 
275 276 

AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA 1692 

TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC 1752 

GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT 1812 

GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT 187 2 

CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC 1932 

TGGTATGGGT TTAACGTTTA CCTGGCGGCG GGCATGTTGC GGGGAATTC 1981 
FIG. 2j: 
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GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 290 
Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
15 10 

GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 
Val Glu Glu Gly He Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 
15 20 25 30 

AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val L'eu Glu 
35 40 45 

GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 

GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 70 75 

ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGGAGAG 531 
Thr Asp Ala Gly Pro Glu He Leu Gin Glu Lys He Arg 
80 85 90 91 

GCGGTTTGCG TATTGGGCGC AT G C AT AAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA 591 

CATGGAAGCC ATCACAAACG GCATGATGAA CCTGAATCGC CAG CGG CATC AGCACCTTGT 651 

CGCCTTGCGT ATAATATTTG CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC 711 

CCAGTTGACA TAAGCCTGTT CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG 771 

CAACTGGTCC AGAACCTTGA CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT 8 31 

GGCTTGTTAT GACTGTTTTT TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG 8 91 

TTACGCCGTG GGTCGATGTT TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC 94 7 

Met Leu Arg Ser Ser 
1 5 

AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC 995 
Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly 
10 15 20 

TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC 104 3 

Ser Ser Met Gly He He Arg Thr Cys Arg Leu Gly Pro Asp Gin Val 
25 30 35 
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AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC 1091 
Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp 
40 45 50 

GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC 1139 
Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn 
55 60 65 

TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA 1187 
Leu Leu Arg Ser Lys Thr Phe lie Ala Leu Ala Ala Phe Asp Gin Glu 
70 75 80 85 

GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG 1235 
Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin 
90 95 100 

CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC 128 3 

Pro Arg Ser Glu He Tyr He Tyr Asp Leu Ala Val Ser Gly Glu His 
105 110 115 

CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG 1331 
Arg Arg Gin Gly He Ala Thr Ala Leu He Asn Leu Leu Lys His Glu 
120 125 130 

GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT 137 9 

Ala Asn Ala Leu Gly Ala Tyr Val He Tyr Val Gin Ala Asp Tyr Gly 
135 140 145 

GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA 14 27 

Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly He Arg Glu Glu 
150 155 160 165 

GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC 14 7 6 

Val Met His Phe Asp lie Asp Pro Ser Thr Ala Thr 
170 175 177 

AAGCCGAGAT CGGCTTCCCC GAG CAG GGC ATG AAG CAG TTC CTT GAC GAG 152 6 

Glu Gin Gly Met Lys Gin Phe Leu Asp Glu 
255 260 

AAA AGC ATC AAG CCG GGC TTG CAG ACC TAC AAG CGC TGA TAAATGCGCC 1575 
Lys Ser He Lys Pro Gly Leu Gin Thr Tyr Lys Arg 
265 270 275 276 

GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA T AAT GAC AAT AATGAGGAGT GCCCAATGTT 1635 

TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA TCTGATGAGC GCACCTTCGA 1695 

GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA 1755 

TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT GAATGGGCGG CGCTTGCTCC 1815 



GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT CTAGAGGACC GTTCTTCCGA 1875 
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GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC TGGTATGGGT TTAACGTTTA 1935 
CCTGGCGGCG GGCATGTTGC GGGGAATTC 196^ 
FIG. 2k: 
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GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 2 90 

Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
1 5 10 

GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC 338 
Val Glu Glu Gly He Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 
15 20 25 30 

AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 
35 40 45 

GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 

GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 "70 75 

ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGC GAG CAG 530 
Thr Asp Ala Gly Pro Glu He Leu Gin Glu Lys He Arg Arg Glu Gin 
80 85 90 92 255 

GGC ATG AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG 57 8 

Gly Met Lys Gin Phe Leu Asp Glu Lys Ser lie Lys Pro Gly Leu Gin 
260 265 270 

ACC TAC AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA 633 
Thr Tyr Lys Arg 
275 276 

T AAT GAC AAT AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC 693 

TTGTTCAGCA TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT 753 

ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC 813 

TGCGTTTCCT GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC 87 3 

GGCGGATCTT CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC 933 

AGCGGGAAAC TGGTATGGGT TTAACGTTTA CCTGGCGGCG GGCATGTTGC GGGGAATTC 992 



FIG . 21: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55 

Met Phe His Val Pro Leu Leu 
1 5 

ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 
lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 
10 15 20 

CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 
Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 
25 30 35 

TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 
Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 
40 45 50 55 

GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 24 7 

Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 
60 65 70 

GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 2 95 

Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 
75 80 85 

AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 34 3 

Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 
90 95 100 

GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 3 91 

Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin lie Gin 
105 HO 115 

GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 4 39 

Gly Asp Val lie Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 
120 125 130 135 

CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 4 87 

Arg Gin Pro Cys Gly Val Val Leu Gly He Ala Pro Trp Asn Ala Pro 
140 145 ISO 

GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 53 5 

Val He Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 
155 160 165 

ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 58 3 

Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 
170 175 180 

ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 
He Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 
185 190 195 

GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 67 9 

Val He Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 
200 205 210 215 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 
He Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 
220 225 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 775 
Va3 Gly Arg He He Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 
235 240 245 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC -823 
Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 
250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 
Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 
265 270 275 

CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 
Gin Gly Gin He Cys Met Ser Thr Glu Arg Leu He Val Thr Ala Val 
280 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 
Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu He Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GGG 1063 
Ala Asn Ala Gly Gin Arg He Gin Val Leu Val Asp Asp Ala Leu 
330 335 340 342 

GACAGCAAGC GAACCGGAAT TGCCAGCTGG GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG 1123 

CAAAGTAAAC TGGATGGCTT TCTTGCCGCC AAGGATCTGA TGGCGCAGGG GAT C AAG ATC 1183 

T GAT C AAG AG ACAGGATGAG GATCGTTTCG C ATG ATT GAA CAA GAT GGA TTG 12 35 

Met He Glu Gin Asp Gly Leu 
1 5 

CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC 1283 
His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp 
10 15 20 

TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG 1331 
Trp Ala Gin Gin Thr He Gly Cys Ser Asp Ala Ala Val Phe Arg Leu 
25 30 35 

TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT 137 9 

Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly 
40 45 50 55 

GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC 14 27 

Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala 
60 65 70 
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ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG 14 7 5 

Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala 
75 80 85 

GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG 1523 
Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu 
90 95 100 

TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA 1571 
Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met Ala Asp Ala 
105 HO 115 

ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC 1619 
Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His 
120 125 130 135 

CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT 1667 
Gin Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met Glu Ala Gly 
140 145 150 

CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA 1715 
Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro 
155 160 165 

GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT 17 63 

Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp 
170 175 180 

CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA 1811 
Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn lie Met Val Glu 
185 190 195 

AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG 1859 
Asn Gly Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu Gly Val Ala 
200 205 210 215 

GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG 1907 
Asp Arg Tyr Gin Asp lie Ala Leu Ala Thr Arg Asp He Ala Glu Glu 
220 225 230 

CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC 1955 
Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala 
235 240 245 

GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC 2003 
Ala Pro Asp Ser Gin Arg He Ala Phe Tyr Arg Leu Leu Asp Glu Phe 
250 255 260 

TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC CG GCC CAG 2057 
Phe Ala G l n 

264 ^21 

CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT GTG CAT GAC 2105 
Arg Val Asp Ser Gly He Cys His He Asn Gly Pro Thr Val His Asp 
425 430 435 
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GAG GCT CAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC TAC GGC AGC 2153 
Glu Ala Gin Met Pro Phe Gly Gly Val Lys Ser Ser Gly Tyr Gly Ser 
440 445 450 

TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG CGC TGG CTG 2201 
Phe Gly Ser Arg Ala Ser lie Glu His Phe Thr Gin Leu Arg Trp Leu 
455 460 465 470 

ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA ATCGATCTTC 224 7 

Thr lie Gin Asn Gly Pro Arg His Tyr Pro He 
475 480 481 

GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA CTTGATAAAA 2307 

ACAGAGCTGT TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG 2367 

AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCATGCTC TGCTCAGCCA 2 4 27 

CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA CGCTGGAGGT 2 4 87 

ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT TC 2539 

FIG. 2m: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55 

Met Phe His Val Pro Leu Leu 
1 5 

ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 
lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 
10 15 20 

CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 
Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 
25 30 35 

TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 
Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 
40 45 50 55 

GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 24 7 

Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 
60 65 70 

GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 2 95 

Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 
75 80 85 

AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 34 3 

Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 
90 95 100 

GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 391 
Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin lie Gin 
105 HO 115 

GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 4 39 

Gly Asp Val lie Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 
120 125 130 135 

CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 4 87 

Arg Gin Pro Cys Gly Val Val Leu Gly He Ala Pro Trp Asn Ala Pro 
140 145 150 

GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 5 35 

Val He Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 
155 160 165 

ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 58 3 

Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 
170 1*75 180 

ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 
He Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 
185 190 195 

GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 67 9 

Val He Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 
200 205 210 215 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 
lie Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 
220 225 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 77 5 

Val Gly Arg lie He Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 
235 240 245 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 
Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 
250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 
Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 
265 270 275 

CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 
Gin Gly Gin He Cys Met Ser Thr Glu Arg Leu He Val Thr Ala Val 
280 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 9 67 

Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu He Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTGGGGAGAG GCGGTTTGCG TATTGGGCGC 10 69 

Ala Asn Ala Gly Gin Arg He Gin 
330 335 

AT G C AT AAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG 112 9 

GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT AT AAT AT TTG 118 9 

CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT 124 9 

CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AG AACCT T G A 1309 

CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT 1369 

TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT 142 9 

TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG 14 80 

Met Leu Arg Ser Ser Asn Asp Val Thr Gin 
1 5 10 

CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC 1528 
Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly Ser Ser Met Gly He 
15 20 25 

ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT 157 6 

He Arg Thr Cys Arg Leu Gly Pro Asp Gin Val Lys Ser Met Arg Ala 
30 35 40 
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GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC 1624 
Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser 
45 50 55 

CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG 1672 
Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys 
60 65 70 

ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT 17 20 

Thr Phe lie Ala Leu Ala Ala Phe Asp Gin Glu Ala Val Val Gly Ala 
75 80 85 90 

CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC 17 68 

Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin Pro Arg Ser Glu lie 
95 100 105 

TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT 1816 
Tyr lie Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gin Gly lie 
110 115 120 

GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT 18 64 

Ala Thr Ala Leu lie Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly 
125 130 135 

GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG 1912 
Ala Tyr Val lie Tyr Val Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val 
140 145 150 

GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT 1960 
Ala Leu Tyr Thr Lys Leu Gly lie Arg Glu Glu Val Met His Phe Asp 
155 160 165 170 

ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA 2014 
lie Asp Pro Ser Thr Ala Thr 
175 177 

A TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT 2063 
Leu Ala Gin Arg Val Asp Ser Gly lie Cys His He Asn Gly Pro Thr 
420 425 430 435 

GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC 2111 
Val His Asp Glu Ala Gin Met Pro Phe Gly Gly Val Lys Ser Ser Gly 
440 445 450 

TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG 2159 
Tyr Gly Ser Phe Gly Ser Arg Ala Ser He Glu His Phe Thr Gin Leu 
455 460 465 

CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA 2204 
Arg Trp Leu Thr lie Gin Asn Gly Pro Arg His Tyr Pro He 
470 475 480 481 

ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA 2264 



CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT 2 32 4 
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CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCATGCTC 238 4 

TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA 24 4 4 

CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT 2504 

TC 2506 
FIG. 2n: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 5 5 

Met Phe His Val Pro Leu Leu 
1 5 

ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 
lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 
10 15 20 

CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 
Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 
25 30 35 

TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 
Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 
40 45 50 55 

GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 24 7 

Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 
60 65 70 

GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 2 95 

Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 
75 80 85 

AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 34 3 

Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 
90 95 100 

GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 391 
Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin lie Gin 
105 110 115 

GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 4 39 

Gly Asp Val lie Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 
120 125 130 135 

CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 4 87 

Arg Gin Pro Cys Gly Val Val Leu Gly lie Ala Pro Trp Asn Ala Pro 
140 145 150 

GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 
Val lie Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 
155 160 165 

ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 58 3 

Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 
170 175 180 

ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 
lie Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 
185 190 195 

GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 67 9 

Val lie Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 
200 205 210 215 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 
lie Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 
220 225 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 77 5 

Val Gly Arg lie He Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 
235 240 245 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 
Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 
250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 
Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 
265 270 275 

CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG AC A GCA GTC 919 
Gin Gly Gin He Cys Met Ser Thr Glu Arg Leu He Val Thr Ala Val 
280 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 
Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu He Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GCA 10 63 

Ala Asn Ala Gly Gin Arg He Gin Val Leu Val Asp Asp Ala Leu Ala 
330 335 340 

AAA GGC GCG CAATGGAA TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT 1113 
Lys Gly Ala Leu Ala Gin Arg Val Asp Ser Gly He Cys His 

345 346 420 425 430 

ATC AAT GGA CCG ACT GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG 1161 
He Asn Gly Pro Thr Val His Asp Glu Ala Gin Met Pro Phe Gly Gly 
435 440 445 

GTG AAG TCC AGC GGC TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG 1209 
Val Lys Ser Ser Gly Tyr Gly Ser Phe Gly Ser Arg Ala Ser He Glu 
450 455 460 

CAC TTT ACC CAG CTG CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC 1257 
His Phe Thr Gin Leu Arg Trp Leu Thr He Gin Asn Gly Pro Arg His 
465 470 475 

TAT CCA ATC TAA ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT 130 9 

Tyr Pro lie 
480 481 

CGCCTCATTT CAATCTCTAA CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA 1369 



AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA 14 29 
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CCGCAGGCAT CATCATGCTC TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT 14 8 9 

CCGGTTGAGG TTACGCAAGA CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT 154 9 

CTTCCCTTCC CGGGTGGAAT TC 1571 
FIG. 2o: 
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GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112 

Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
15 10 

GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp lie Asp Cys Gly 
15 20 25 

GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 
Gly Ala Leu Ser Leu Val Ser Pro lie Asp Leu Gly Val Lys Val Ala 
30 35 40 

CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC 25 6 

Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 
45 50 55 60 

GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 304 
Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 
65 "70 75 

CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 
Pro Arg His He Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 
80 85 90 

TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG 4 00 

Leu Gly Val Gin Arg He Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 
95 100 105 

GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 44 8 

Ala Gly Glu Gin He Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 
110 115 120 

GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 4 96 

Ala Glu Ser Met Ser Arg Asn Pro He Ala Ser Tyr Thr His Arg Gly 
125 130 135 140 

GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 54 4 

Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 
145 150 155 

GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 592 
Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met He Ala Thr Ala Glu 
160 165 170 

AAC CTG GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT 64 8 
Asn Leu 
174 

TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 7 08 



GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA 

Met He Glu Gin 
1 



763 
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GAT GGA TTG CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC 811 
Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe 
5 10 15 20 

GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG 8 59 

G]y Tyr Asp Trp Ala Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val 
25 30 35 

TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC 907 
Phe Arg Leu Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp 
40 45 50 

CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG 955 
Leu Ser Gly Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser 
55 60 65 

TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC 1003 
Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val 
70 *75 80 

ACT GAA GCG GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG 1051 
Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin 
85 90 95 100 

GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG 1099 
Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met 
105 HO 115 

GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA 1147 
Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro 
120 125 130 

TTC GAC CAC CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG 1195 
Phe Asp His Gin Ala Lys His Arg He Glu Arg Ala Arg Thr Arg Met 
135 1^0 145 

GAA GCC GGT CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG 124 3 

Glu Ala Gly Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly 
150 155 160 

CTC GCG CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC 12 91 

Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 
165 170 175 180 

GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC 1339 
Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn He 
185 190 195 

ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG 1387 
Met Val Glu Asn Gly Arg Phe Ser Gly Phe He Asp Cys Gly Arg Leu 
200 205 210 

GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT 14 35 

Gly Val Ala Asp Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He 
215 220 225 
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GCT GAA GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC 14 83 

Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr 
230 235 240 

GGT ATC GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT 1531 
Gly lie Ala Ala Pro Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu 
245 250 255 260 

GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 158 6 

Asp Glu Phe Phe 
264 

CA TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG ATC GTG GCT 1633 
Leu Arg Ala Gin Glu Glu Lys Trp lie Asp Gin Glu lie Val Ala 
197 200 205 210 

GTT ACG GAT GAA CAG TTC GAT TTA GAG GGC TAC AAC AGT CGA GCA ATT 1681 
Val Thr Asp Glu Gin Phe Asp Leu Glu Gly Tyr Asn Ser Arg Ala lie 
215 220 225 

GAA CTG CCT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC ATC CGC GGC 1729 
Glu Leu Pro Arg Lys Ala Lys Leu Leu lie Val Thr Val lie Arg Gly 
230 235 240 

CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT CAT TCT GGC 1777 
Leu Ala Val Phe Glu Ala Leu Ser Arg Leu Lys Pro Val His Ser Gly 
245 250 255 

GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC GGC GCC GCG 182 5 

Gly Val Gin Thr Ala Gly Asn Ser Cys Ala Val Val Asp Gly Ala Ala 
260 265 270 275 

GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG GTC TTG GCT 187 3 

Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gin Pro Val Leu Ala 
280 285 290 

AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG CAT ATG GGG 1921 
Arg He Leu Ala Thr Ser Val Val Gly He Glu Pro Glu His Met Gly 
295 300 305 

CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT AGT GAT CTT 1969 
Leu Gly Pro Ala Pro Ala lie Arg Leu Leu Leu Ala Arg Ser Asp Leu 
310 315 320 

AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG CAG GCC GCC 2017 
Ser Leu Arg Asp He Asp Leu Phe Glu He Asn Glu Ala Gin Ala Ala 
325 330 335 

CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC TCA AAA CTT 2065 
Gin Val Leu Ala Val Gin His Glu Leu Gly He Glu His Ser Lys Leu 
340 345 350 355 

AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT GCC GCG ACC 2113 
Asn He Trp Gly Gly Ala He Ala Leu Gly His Pro Leu Ala Ala Thr 
360 365 370 
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GGA TTG CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA GCT AAT AAC 2161 
Gly Leu Arg Leu Cys Met Thr Leu Ala His Gin Leu Gin Ala Asn Asn 
375 380 385 

TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA CAG GGG ATG 2 209 

Phe Arg Tyr Gly lie Ala Ser Ala Cys lie Gly Gly Gly Gin Gly Met 
390 395 400 

GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT GCA CGA AGT 2257 
Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser Ala Arg Ser 
405 410 415 

TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA CGGGCATCTC 2306 
Ser Met lie Asn Arg Val Asp His Tyr Pro Leu Ser 
420 425 430 431 

CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA 2366 

GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT 24 26 

AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT 24 8 6 

TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC 252 6 



FIG. 2p: 
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GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112 

Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
15 10 



GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp He Asp Cys Gly 
15 20 25 

GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 
Gly Ala Leu Ser Leu Val Ser Pro He Asp Leu Gly Val Lys Val Ala 
30 35 40 

CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC 2 56 

Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 
45 50 55 60 

GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 30 4 

Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 
65 70 75 

CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 
Pro Arg His He Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 
80 85 90 

TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG 4 00 

Leu Gly Val Gin Arg He Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 
95 100 105 

GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 44 8 

Ala Gly Glu Gin He Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 
110 H5 120 

GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 4 96 

Ala Glu Ser Met Ser Arg Asn Pro He Ala Ser Tyr Thr His Arg Gly 
125 130 135 140 

GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 54 4 

Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 
145 150 155 

GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 5 92 

Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met He Ala Thr Ala Glu 
160 165 170 



AAC CTG GGGGAGAGGC GGTTTGCGTA TTGGGCGCAT G C AT AAAAAC TGTTGTAATT 64 8 
Asn Leu 
174 

CATTAAGCAT TCTGCCGACA TGGAAGCCAT CACAAACGGC AT GAT G AAC C TGAATCGCCA 7 08 

GCGGCATCAG CACCTTGTCG CCTTGCGTAT AATATTTGCC CATGGACGCA CACCGTGGAA 7 68 

ACGGATGAAG GCACGAACCC AGTTGACATA AGCCTGTTCG GTTCGTAAAC TGTAATGCAA 8 28 

GTAGCGTATG CGCTCACGCA ACTGGTCCAG AACCTTGACC GAACGCAGCG GTGGTAACGG 8 88 
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CGCAGTGGCG GTTTTCATGG CTTGTTATGA CTGTTTTTTT GTACAGTCTA TGCCTCGGGC 948 

ATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTTTG ATGTTATGGA GCAGCAACG 1007 

ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA 105 5 

Met Leu Arg Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys 
15 10 15 

ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC 110 3 

Thr Lys Leu Gly Gly Ser Ser Met Gly lie lie Arg Thr Cys Arg Leu 
20 25 30 

GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT 1151 
Gly Pro Asp Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly 
35 40 45 

CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC 1199 
Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser 
50 55 60 

GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT 124 7 

Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys Thr Phe lie Ala Leu Ala 
65 70 75 80 

GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG 12 95 

Ala Phe Asp Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu 
85 90 95 

CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA 134 3 

Pro Arg Phe Glu Gin Pro Arg Ser Glu lie Tyr He Tyr Asp Leu Ala 
100 105 110 

GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT 1391 
Val Ser Gly Glu His Arg Arg Gin Gly He Ala Thr Ala Leu He Asn 
115 120 125 

CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG 14 39 

Leu Leu Lys His Glu Ala Asn Ala Leu Gly Ala Tyr Val lie Tyr Val 
130 135 140 

CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG 14 87 

Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu 
145 150 155 160 

GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC 15 35 

Gly He Arg Glu Glu Val Met His Phe Asp He Asp Pro Ser Thr Ala 
165 170 175 

ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA TTG AGG. GCG CAA GAG GAG 158 9 

Thr Leu Arg Ala Gin Glu Glu 

177 197 200 



AAA TGG ATT GAC CAA GAG ATC GTG GCT GTT ACG GAT GAA CAG TTC GAT 
Lys Trp He Asp Gin Glu He Val Ala Val Thr Asp Glu Gin Phe Asp 
205 210 215 



1637 
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TTA GAG GGC TAC AAC AGT CGA GCA ATT GAA CTG CCT CGG AAG GCA AAA 168 5 

Leu Glu Gly Tyr Asn Ser Arg Ala lie Glu Leu Pro Arg Lys Ala Lys 
220 225 230 

TTG TTG ATC GTG ACA GTC ATC CGC GGC CTA GCA GTC TTT GAA GCC CTT 17 33 

Leu Leu lie Val Thr Val lie Arg Gly Leu Ala Val Phe Glu Ala Leu 
235 240 245 250 

TCC CGA TTG AAG CCT GTT CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC 1781 
Ser Arg Leu Lys Pro Val His Ser Gly Gly Val Gin Thr Ala Gly Asn 
255 260 265 

AGC TGT GCC GTA GTG GAC GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG 182 9 

Ser Cys Ala Val Val Asp Gly Ala Ala Ala Ala Leu Val Ala Arg Glu 
270 275 280 

TCG TCT GCG ACA CAG CCG GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA 1877 
Ser Ser Ala Thr Gin Pro Val Leu Ala Arg He Leu Ala Thr Ser Val 
285 290 295 

GTC GGG ATC GAG CCC GAG CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT 192 5 

Val Gly He Glu Pro Glu His Met Gly Leu Gly Pro Ala Pro Ala He 
300 305 310 

CGC CTG CTG CTT GCG CGT AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC 197 3 

Arg Leu Leu Leu Ala Arg Ser Asp Leu Ser Leu Arg Asp He Asp Leu 
315 320 325 330 

TTT GAG ATA AAC GAG GCG CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT 2021 
Phe Glu He Asn Glu Ala Gin Ala Ala Gin Val Leu Ala Val Gin His 
335 340 345 

GAA TTG GGT ATT GAG CAC TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT 2069 
Glu Leu Gly He Glu His Ser Lys Leu Asn He Trp Gly Gly Ala He 
350 355 360 

GCA CTT GGA CAC CCG CTT GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC 2117 
Ala Leu Gly His Pro Leu Ala Ala Thr Gly Leu Arg Leu Cys Met Thr 
365 370 375 

CTC GCT CAC CAA TTG CAA GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG 2165 
Leu Ala His Gin Leu Gin Ala Asn Asn Phe Arg Tyr Gly He Ala Ser 
380 385 390 

GCA TGC ATT GGT GGG GGA CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC 2213 
Ala Cys He Gly Gly Gly Gin Gly Met Ala Val Leu Leu Glu Asn Pro 
395 400 405 410 

CAC TTC GGT TCG TCC TCT GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC 22 61 

His Phe Gly Ser Ser Ser Ala Arg Ser Ser Met He Asn Arg Val Asp 
415 420 425 

CAC TAT CCA CTG AGC TAA CGGGCATCTC CTTTGTTGCT TTGAGGTGGC 2309 
His Tyr Pro Leu Ser 
430 431 
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GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA GAAGGAACAG GGAACATGAT 2369 

TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT AAACTTGCCC TTGCCTTCGC 24 29 

ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT TTCTACAGTG TACATACCTT 24 8 9 

GTCAGGGTTG GTGGGAATTC 2509 
FIG . 2q: 
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GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC 112 

Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
15 10 

GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp He Asp Cys Gly 
15 20 25 

GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 208 
Gly Ala Leu Ser Leu Val Ser Pro He Asp Leu Gly Val Lys Val Ala 
30 35 40 

CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC 2 56 

Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 
45 50 55 60 

GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC 304 
Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 
65 70 75 

CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 
Pro Arg His He Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 
80 85 90 

TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG 4 00 

Leu Gly Val Gin Arg He Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 
95 100 105 

GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 448 
Ala Gly Glu Gin He Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 
110 115 120 

GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 4 96 

Ala Glu Ser Met Ser Arg Asn Pro lie Ala Ser Tyr Thr His Arg Gly 
125 130 135 140 

GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 54 4 

Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 
145 150 155 

GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 592 
Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met He Ala Thr Ala Glu 
160 165 170 

AAC CTG GCG CGC A TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG 64 1 

Asn Leu Ala Arg Leu Arg Ala Gin Glu Glu Lys Trp He Asp Gin Glu 
175 176 197 200 205 

ATC GTG GCT GTT ACG GAT GAA CAG TTC GAT TTA GAG GGC TAC AAC AGT 68 9 

He Val Ala Val Thr Asp Glu Gin Phe Asp Leu Glu Gly Tyr Asn Ser 
210 215 220 



CGA GCA ATT GAA CTG CCT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC 
Arg Ala He Glu Leu Pro Arg Lys Ala Lys Leu Leu He Val Thr Val 
225 230 235 240 
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ATC CGC GGC CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT 785 
He Arg Gly Leu Ala Val Phe Glu Ala Leu Ser Arg Leu Lys Pro Val 
245 250 255 

CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC 833 
His Ser Gly Gly Val Gin Thr Ala Gly Asn Ser Cys Ala Val Val Asp 
260 265 270 

GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG 881 
Gly Ala Ala Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gin Pro 
275 280 285 

GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG 929 
Val Leu Ala Arg He Leu Ala Thr Ser Val Val Gly He Glu Pro Glu 
290 295 300 

CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT 977 
His Met Gly Leu Gly Pro Ala Pro Ala He Arg Leu Leu Leu Ala Arg 
305 310 315 - 320 

AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG 1025 
Ser Asp Leu Ser Leu Arg Asp He Asp Leu Phe Glu He Asn Glu Ala 
325 330 335 

CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC 107 3 

Gin Ala Ala Gin Val Leu Ala Val Gin His Glu Leu Gly lie Glu His 
340 345 350 

TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT 1121 
Ser Lys Leu Asn He Trp Gly Gly Ala He Ala Leu Gly His Pro Leu 
355 360 365 

GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA 1169 
Ala Ala Thr Gly Leu Arg Leu Cys Met Thr Leu Ala His Gin Leu Gin 
370 375 380 

GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA 1217 
Ala Asn Asn Phe Arg Tyr Gly He Ala Ser Ala Cys He Gly Gly Gly 
385 390 395 400 

CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT 1265 
Gin Gly Met Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser 
405 410 415 

GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA 1313 
Ala Arg Ser Ser Met He Asn Arg Val Asp His Tyr Pro Leu Ser 
420 425 430 431 

CGGGCATCTC CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA 137 3 

AAAACAAGAA GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG 14 33 

AGTCCAGGCT AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC 14 93 

CGGCACGGGT TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC 154 3 



FIG. 2r: 
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Sequenz 1 



CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG 4 80 

TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 54 0 

CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAAGGCAT 600 

CGATAAGGCC ATCGGGACAG CAAGCGAACC GGAATTGCCA GCTGGGGCGC CCTCTGGTAA 660 

GGTTGGGAAG CCCTGCAAAG TAAACTGGAT GGCTTTCTTG CCGCCAAGGA TCTGATGGCG 720 

CAGGGGATCA AGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA TTGAACAAGA 780 

TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT ATGACTGGGC 84 0 

ACAACAGACA ATCGGCTGCT CTGATGCCGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC 900 

GGTTCTTTTT GTCAAGACCG ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC 960 

GCGGCTATCG TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 1020 

TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC 1080 

TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC GGCTGCATAC 114 0 

GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA CATCGCATCG AGCGAGCACG 1200 

TACTCGGATG GAAGCCGGTC TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT 1260 

CGCGCCAGCC GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT 1320 

CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG 1380 

ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG CGTTGGCTAC 14 4 0 

CCGTGATATT GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC CGCTTCCTCG TGCTTTACGG 1500 

TATCGCCGCT CCCGATTCGC AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG 1560 

AGCGGGACTC TGGGGTTCGA AATGACCGAC CAAGCGACGC CCTGGCCGCG GTGATTGCAT 1620 

TCATGTGTGC TGAGGAGTCA CGTTGGATCA ACGGCATAAA TATTCCAGTG GACGGAGGTT 1680 

TGGCATCGAC CTACGTGTAA GTTCGTGGAC GCCCTTTGCA CGCGCACTAT ATCTCTATGC 17 4 0 

AGCAGCTGAA AGCAGCTTTG GTTTTGATCG GAGGTAGCGG GCGGAAAGGT GCAGAATGTC 1800 

TAAATAATAA AGGATTCTTG TGAAGCTTTA GTTGTCCGTA AACGAAAATA AAAATAAAGA 18 60 

GGAATGATAT GAAAGCAAGT AGATCAGTCT GCACTTTCAA AATAGCTACC CTGGCAGGCG 1920 

CCATTTATGC AGCGCTGCCA ATGTCAGCTG CAAACTCGAT GCAGCTGGAT GTAGGTAGCT 1980 

CGGATTGGAC GGTGCGTTGG GGACAACACC CTCAAGTATA GCCTTGCCTC TCGCCTGAAT 204 0 

GAGCAAGACT CAAGTCTGAC AAATGCGCCG ACTGTCAATG GTTATATCCG GATATTCAAA 2100 

GTCAGGGTGA TCGTAACTTT GACCGGGGGC TTGGTATCCA ATCGTCTCGA TATTCTGGCT 2160 

GCAG 2164 
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Sequenz 2 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 240 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 3 60 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG 4 80 

TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 54 0 

CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAGGGGAG 600 

AGGCGGTTTG CGTATTGGGC GCATGCATAA AAACTGTTGT AATTCATTAA GCATTCTGCC 660 

GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA TCAGCACCTT 720 

GTCGCCTTGC GTATAATATT TGCCCATGGA CGCACACCGT GGAAACGGAT GAAGGCACGA 7 80 

ACCCAGTTGA CATAAGCCTG TTCGGTTCGT AAACTGTAAT GCAAGTAGCG TATGCGCTCA 84 0 

CGCAACTGGT CCAGAACCTT GACCGAACGC AGCGGTGGTA ACGGCGCAGT GGCGGTTTTC 900 

ATGGCTTGTT ATGACTGTTT TTTTGTACAG TCTATGCCTC GGGCATCCAA GCAGCAAGCG 9 60 

CGTTACGCCG TGGGTCGATG TTTGATGTTA TGGAGCAGCA ACGATGTTAC GCAGCAGCAA 1020 

CGATGTTACG CAG CAGGGCA GTCGCCCTAA AACAAAGTTA GGTGGCTCAA GTATGGGCAT 1080 

CATTCGCACA TGTAGGCTCG GCCCTGACCA AGTCAAATCC ATGCGGGCTG CTCTTGATCT 114 0 

TTTCGGTCGT GAGTTCGGAG ACGTAGCCAC CTACTCCCAA CATCAGCCGG ACTCCGATTA 1200 

CCTCGGGAAC TTGCTCCGTA GTAAGACATT CATCGCGCTT GCTGCCTTCG ACCAAGAAGC 1260 

GGTTGTTGGC GCTCTCGCGG CTTACGTTCT GCCCAGGTTT GAGCAGCCGC GTAGTGAGAT 1320 

CTATATCTAT GATCTCGCAG TCTCCGGCGA GCACCGGAGG CAGGGCATTG CCACCGCGCT 1380 

CATCAATCTC CTCAAGCATG AGGCCAACGC GCTTGGTGCT TATGTGATCT ACGTGCAAGC 14 40 

AGATTACGGT GACGATCCCG CAGTGGCTCT CTATACAAAG TTGGGCATAC GGGAAGAAGT 1500 

GATGCACTTT GATATCGACC CAAGTACCGC CACCTAACAA TTCGTTCAAG CCGAGATCGG 1560 

CTTCCCTGAT TGCATTCATG TGTGCTGAGG AGTCACGTTG GATCAACGGC ATAAATATTC 1620 

CAGTGGACGG AGGTTTGGCA TCGACCTACG TGTAAGTTCG TGGACGCCCT TTGCACGCGC 1680 

ACTATATCTC TATGCAGCAG CTGAAAGCAG CTTTGGTTTT GATCGGAGGT AGCGGGCGGA 17 4 0 

AAGGTGCAGA ATGTCTAAAT AATAAAGGAT TCTTGTGAAG CTTTAGTTGT CCGTAAACGA 1800 

AAATAAAAAT AAAGAGGAAT GATATGAAAG CAAGTAGATC AGTCTGCACT TTCAAAATAG 1860 

CTACCCTGGC AGGCGCCATT TATGCAGCGC TGCCAATGTC AGCTGCAAAC TCGATGCAGC 1920 

TGGATGTAGG TAGCTCGGAT TGGACGGTGC GTTGGGGACA ACACCCTCAA GTATAGCCTT 198 0 

GCCTCTCGCC TGAATGAGCA AGACTCAAGT CTGACAAATG CGCCGACTGT CAATGGTTAT 204 0 

ATCCGGATAT TCAAAGTCAG GGTGATCGTA ACTTTGACCG GGGGCTTGGT ATCCAATCGT 2100 

CTCGATATTC TGGCTGCAG 2119 
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Sequenz 3 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG 4 80 

TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 54 0 

CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAAGGCAT 600 

CGATCAACGG CATAAATATT CCAGTGGACG GAGGTTTGGC ATCGACCTAC GTGTAAGTTC 660 

GTGGACGCCC TTTGCACGCG CACTATATCT CTATGCAGCA GCTGAAAGCA GCTTTGGTTT 7 20 

TGATCGGAGG TAGCGGGCGG AAAGGTGCAG AATGTCTAAA TAATAAAGGA TTCTTGTGAA 7 80 

GCTTTAGTTG TCCGTAAACG AAAATAAAAA TAAAGAGGAA TGATATGAAA GCAAGTAGAT 840 

CAGTCTGCAC TTTCAAAATA GCTACCCTGG CAGGCGCCAT TTATGCAGCG CTGCCAATGT 900 

CAGCTGCAAA CTCGATGCAG CTGGATGTAG GTAGCTCGGA TTGGACGGTG CGTTGGGGAC 960 

AACAC'CCTCA AGTATAGCCT TGCCTCTCGC CTGAATGAGC AAGACTCAAG TCTGACAAAT 1020 

GCGCCGACTG TCAATGGTTA TATCCGGATA TTCAAAGTCA GGGTGATCGT AACTTTGACC 1080 

GGGGGCTTGG TATCCAATCG TCTCGATATT CTGGCTGCAG 1120 
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Sequenz 4 

GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AAT T AAA AT A AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 2.0 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGGTGCCCt 4 80 

CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC 54 0 

AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 

TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 

AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 

ACGTGGCCAA ATGGATGGAG CCCGAACATC ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC 7 80 

GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG 84 0 

TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 

CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 

ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 

AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 

CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG 1140 

TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 

ATGCCGGGCA AATCTGTCTG GCACCGGACT ATGTGCTGCT GCCGGAAGGG ACAGCAAGCG 1260 

AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC AAAGTAAACT 1320 

GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT GATCAAGAGA 1380 

CAGGATGAGG ATCGTTTCGC ATGATTGAAC AAGATGGATT GCACGCAGGT TCTCCGGCCG 14 4 0 

CTTGGGTGGA GAGGCTATTC GGCTATGACT GGGCACAACA GACAATCGGC TGCTCTGATG 1500 

CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC GCCCGGTTCT TTTTGTCAAG ACCGACCTGT 1560 

CCGGTGCCCT GAATGAACTG CAGGACGAGG CAGCGCGGCT ATCGTGGCTG GCCACGACGG 1620 

GCGTTCCTTG CGCAGCTGTG CTCGACGTTG TCACTGAAGC GGGAAGGGAC TGGCTGCTAT 1680 

TGGGCGAAGT GCCGGGGCAG GATCTCCTGT CATCTCACCT TGCTCCTGCC GAGAAAGTAT 17 4 0 

CCATCATGGC TGATGCAATG CGGCGGCTGC ATACGCTTGA TCCGGCTACC TGCCCATTCG 1800 

ACCACCAAGC GAAACATCGC ATCGAGCGAG CACGTACTCG GATGGAAGCC GGTCTTGTCG 18 60 

ATCAGGATGA TCTGGACGAA GAGCATCAGG GGCTCGCGCC AGCCGAACTG TTCGCCAGGC 1920 

TCAAGGCGCG CATGCCCGAC GGCGAGGATC TCGTCGTGAC CCATGGCGAT GCCTGCTTGC 1980 

CGAATATCAT GGTGGAAAAT GGCCGCTTTT CTGGATTCAT CGACTGTGGC CGGCTGGGTG 204 0 

TGGCGGACCG CTATCAGGAC ATAGCGTTGG CTACCCGTGA TATTGCTGAA GAGCTTGGCG 2100 

GCGAATGGGC TGACCGCTTC CTCGTGCTTT ACGGTATCGC CGCTCCCGAT TCGCAGCGCA 2160 
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TCGCCTTCTA TCGCCTTCTT GACGAGTTCT TCTGAGCGGG ACTCTGGGGT TCGAAATGAC 2220 

CGACCAAGCG ACGCCCGCCA TGCCAAGCCT GTTCTCGTGC AAAGTCCTGT GGGTGAGTCG 2280 

AACTTGGCGA TGCGCGCACC CTACGGAGAA GCGATCCACG GACTGCTCTC TGTCCTCCTT 234 0 

TCAACGGAGT GTTAGAACCG TTGGTAGTGG TTTTGGACGG GCCCAGGAGC ATGCGCTTCT 24 00 

GGGCCCGTTT CTTGAGTATT CATTGGATAG TCACGCGTGG TAGCTTCGAG CCTGCACAGC 24 60 

TGATGAGCAC CCTGGAAGGC GCGCTGTACG CGGACGACTG GGTTCATCTT CGCCATTCAT 2520 

GACGGAACTC CGTTCCCCAG TACCGCGATG ACTATTTTGC CTCTTCCGAT GTCCGATTCC 2580 

ACGCCGCCTG ACGCTAAGCG GGGGCGGGGG CGCCCGCATC CCAGCCCAGA CAGCAACAAA 2 64 0 

TGAGTAGGCT CTTGGATGCC GCGGCGGCTG AGATTGGTAA CGGCAATTTC GTCAATGTGA 2700 

CGATGGATTC GATTGCCCGT GCTGCCGGCG TCTCAAAAAA AACGCTGTAC GTCTTGGTGG 27 60 

CGAGCAAGGA AGAACTCATT TCCCGGTTAG TGGCTCGAGA CATGTCCAAC CTTGAGGAAT 2820 

TC 2822 
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GAATTCCGCG TATCGCCCGG TTCTATCAGC 
GGTAGGGTCT TTTTCTTGGC CATGCTTGTT 
TGCGTTTGCC GCTTCGCTTC GCGATGAACC 
TTAACTCGCG TAAGCATTCT GTCATTTTTT 
GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG 
CGATTAAGAT AATTAAAATA AGGAAACCGC 
CTCCAGCTCA AGGGCAATTT TTGGGCTATT 
AGAATAACAA TTGACTCCTC AGGAGGTCAG 
CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC 
AGGGGCCTGC AAACTTGGAG CTGCGTCTGA 
TGGAAAATCG TGAAGCAATT GCCGACGCGG 
AGCAAACACT GCTTTGCGAC ATTGCTGGCT 
ACGTGGCCAA ATGGATGGAG CCCGAACATC 
GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG 
TACTGGCCTT TGGGCCGCTG GCCGGCATAT 
CGTCCGAGCT TACCCCGCGG ACTTCTGCCC 
ATGAAACTGA GCTGACTACA GTGCTGGGCG 
AGCCTTTCGA TCATCTGATC TTCACCGGCG 
CCGCGGCGGA TAACCTAGTG CCCGTTACCC 
TTTCCCGCAG TGCAGATATG GCGGACGTTG 
ATGCCGGGCA AATCTGTCTG GCACCGGACT 
GGGCGCATGC ATAAAAACTG TTGTAATTCA 
CAAACGGCAT GATGAACCTG AATCGCCAGC 
TATTTGCCCA TGGACGCACA CCGTGGAAAC 
CCTGTTCGGT TCGTAAACTG TAATGCAAGT 
CCTTGACCGA ACGCAGCGGT GGTAACGGCG 
GTTTTTTTGT ACAGTCTATG CCTCGGGCAT 
GATGTTTGAT GTTATGGAGC AGCAACGATG 
GGCAGTCGCC CTAAAACAAA GTTAGGTGGC 
CTCGGCCCTG ACCAAGTCAA ATCCATGCGG 
GGAGACGTAG CCACCTACTC CCAACATCAG 
CGTAGTAAGA CATTCATCGC GCTTGCTGCC 
GCGGCTTACG TTCTGCCCAG GTTTGAGCAG 
GCAGTCTCCG GCGAGCACCG GAGGCAGGGC 
CATGAGGCCA ACGCGCTTGG TGCTTATGTG 
CCCGCAGTGG CTCTCTATAC AAAGTTGGGC 



Sequenz 5 








GGGCCGCTTT 


CGAAAGTCAT 


GGTGTTAGCC 


60 


GCCTGAACCT 


TCGTTGACAT 


AGGGCAGAGG 


120 


GCATCGAGAT 


GCTGAGGTCA 


GGATTTTTCC 


180 


TGGTGGCTTT 


GAACAGCCTG 


ATGAAAGGTG 


240 


CTTGGCGGCG 


TCGAAGCGAT 


GCTCCACTAC 


300 


ATGGTTTCTT 


ATGTGAATTT 


GTCTGGCATA 


360 


GGCTGAGCAG 


TTGCCTCTAT 


ATGGTTATTC 


4 20 


CG AT GAGC AT 


TCTTGGTTTG 


AATGGTGCCC 


480 


TTGATCGCAT 


GAAGAAGGCG 


CACCTGGAGC 


540 


GTAGGCTGGA 


TCGTGCGATT 


GCAATGCTTC 


600 


TTTCTGCTGA 


CTTTGGCAAT 


CGCAGCCGTG 


660 


CGGTGGCAAG 


CCTGAAGGAT 


AGCCGCGAGC 


720 


ACAAGGCGAT 


GTTTCCAGGG 


GCGGAGGCAC 


780 


GGGTCATTAG 


TCCCTGGAAC 


TTCCCTATCG 


840 


TCGCAGCAGG 


TAATCGCGCC 


ATGCTCAAGC 


900 


TGCTTGCGGA 


GCTAATTGCT 


CGTTACTTCG 


960 


ACGCTGAAGT 


CGGTGCGCTG 


TTCAGTGCTC 


1020 


GCACTGCCGT 


GGCCAAGCAC 


ATCATGCGTG 


1080 


TGGAATTGGG 


TGGCAAATCG 


CCGGTGATCG 


1140 


CACAACGGGT 


GTTGACGGTG 


AAAACCTTCA 


1200 


ATGTGCTGGG 


GGAGAGGCGG 


TTTGCGTATT 


1260 


TTAAGCATTC 


TGCCGACATG 


GAAGCCATCA 


1320 


GGCATCAGCA 


CCTTGTCGCC 


TTGCGTATAA 


1380 


GGATGAAGGC 


ACGAACCCAG 


TTGACATAAG 


1440 


AGCGTATGCG 


CTCACGCAAC 


TGGTCCAGAA 


1500 


CAGTGGCGGT 


TTTCATGGCT 


TGTTATGACT 


1560 


CCAAGCAGCA 


AGCGCGTTAC 


GCCGTGGGTC 


1620 


TTACGCAGCA 


GCAACGATGT 


TACGCAGCAG 


1680 


TCAAGTATGG 


GCATCATTCG 


CACATGTAGG 


1740 


GCTGCTCTTG 


ATCTTTTCGG 


TCGTGAGTTC 


1800 


CCGGACTCCG 


ATTACCTCGG 


GAACTTGCTC 


1860 


TTCGACCAAG 


AAGCGGTTGT 


TGGCGCTCTC 


1920 


CCGCGTAGTG 


AGATCTATAT 


CTATGATCTC 


1980 


ATTGCCACCG 


CGCTCATCAA 


TCTCCTCAAG 


2040 


ATCTACGTGC 


AAGCAGATTA 


CGGTGACGAT 


2100 


ATACGGGAAG 


AAGTGATGCA 


CTTTGATATC 


2160 
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GACCCAAGTA CCGCCACCTA ACAATTCGTT CAAGCCGAGA TCGGCTTCCC TGCAAAGTCC 2220 

TGTGGGTGAG TCGAACTTGG CGATGCGCGC ACCCTACGGA GAAGCGATCC ACGGACTGCT 2280 

CTCTGTCCTC CTTTCAACGG AGTGTTAGAA CCGTTGGTAG TGGTTTTGGA CGGGCCCAGG 234 0 

AGCATGCGCT TCTGGGCCCG TTTCTTGAGT ATTCATTGGA TAGTCACGCG TGGTAGCTTC 24 00 

GAGCCTGCAC AGCTGATGAG CACCCTGGAA GGCGCGCTGT ACGCGGACGA CTGGGTTCAT 2 4 60 

CTTCGCCATT CATGACGGAA CTCCGTTCCC CAGTACCGCG ATGACTATTT TGCCTCTTCC 2520 

GATGTCCGAT TCCACGCCGC CTGACGCTAA GCGCGGGCGG GGGCGCCCGC ATCCCAGCCC 258 0 

AGACAGCAAC AAATGAGTAG GCTCTTGGAT GCCGCGGCGG CTGAGATTGG TAACGGCAAT 2 64 0 

TTCGTCAATG TGACGATGGA TTCGATTGCC CGTGCTGCCG GCGTCTCAAA AAAAACGCTG 27 0.0 

TACGTCTTGG TGGCGAGCAA GGAAGAACTC ATTTCCCGGT TAGTGGCTCG AGACATGTCC 2 7 60 

AACCTTGAGG AATTC 2775 
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Sequenz 6 

GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 2.0 

AGAATAACAA TTGACTCCTC AGGAGGTCAG C GAT GAG CAT TCTTGGTTTG AATGGTGCCC 4 80 

CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC 54 0 

AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 

TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 

AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 

ACGTGGCCAA AT G GAT G GAG CCCGAACATC ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC 780 

GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG 84 0 

TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 

CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 

ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 

AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 

CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG 1140 

TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 

ATGCCGGGCA AATCTGTCTG GCACCGTGGG TGAGTCGAAC TTGGCGATGC GCGCACCCTA 12 60 

CGGAGAAGCG ATCCACGGAC TGCTCTCTGT CCTCCTTTCA ACGGAGTGTT AGAACCGTTG 1320 

GTAGTGGTTT TGGACGGGCC CAGGAGCATG CGCTTCTGGG CCCGTTTCTT GAGTATTCAT 1380 

TGGATAGTCA CGCGTGGTAG CTTCGAGCCT GCACAGCTGA TGAGCACCCT GGAAGGCGCG 14 4 0 

CTGTACGCGG ACGACTGGGT TCATCTTCGC CATTCATGAC GGAACTCCGT TCCCCAGTAC 1500 

CGCGATGACT ATTTTGCCTC TTCCGATGTC CGATTCCACG CCGCCTGACG CTAAGCGGGG 15 60 

GCGGGGGCGC CCGCATCCCA GCCCAGACAG CAACAAATGA GTAGGCTCTT GGATGCCGCG 1620 

GCGGCTGAGA TTGGTAACGG CAATTTCGTC AATGTGACGA TGGATTCGAT TGCCCGTGCT 1680 

GCCGGCGTCT CAAAAAAAAC GCTGTACGTC TTGGTGGCGA GCAAGGAAGA ACTCATTTCC 17 4 0 

CGGTTAGTGG CTCGAGACAT GTCCAACCTT GAGGAATTC 177 9 
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Seqpjienz 7 

CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGG AG AG T CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 

TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 4 20 

AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 4 80 

AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 54 0 

AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 

CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 

ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 

ATGCAGCACC TTTCCAGGGG ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG 78 0 

GTAAGGTTGG GAAGCCCTGC AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT 840 

GGCGCAGGGG ATCAAGATCT GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATGATTGAAC 900 

AAGATGGATT GCACGCAGGT TCTCCGGCCG CTTGGGTGGA GAGGCTATTC GGCTATGACT 960 

GGGCACAACA GACAATCGGC TGCTCTGATG CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC 1020 

GCCCGGTTCT TTTTGTCAAG ACCGACCTGT CCGGTGCCCT GAATGAACTG CAGGACGAGG 1080 

CAGCGCGGCT ATCGTGGCTG GCCACGACGG GCGTTCCTTG CGCAGCTGTG CTCGACGTTG 114 0 

TCACTGAAGC GGGAAGGGAC TGGCTGCTAT TGGGCGAAGT GCCGGGGCAG GATCTCCTGT 1200 

CATCTCACCT TGCTCCTGCC GAGAAAGTAT CCATCATGGC TGATGCAATG CGGCGGCTGC 12 60 

ATACGCTTGA TCCGGCTACC TGCCCATTCG ACCACCAAGC GAAACATCGC ATCGAGCGAG 1320 

CACGTACTCG GATGGAAGCC GGTCTTGTCG AT C AG GAT G A TCTGGACGAA GAGCATCAGG 1380 

GGCTCGCGCC AGCCGAACTG TTCGCCAGGC TCAAGGCGCG CATGCCCGAC GGCGAGGATC 14 4 0 

TCGTCGTGAC CCATGGCGAT GCCTGCTTGC CGAATATCAT GGTGGAAAAT GGCCGCTTTT 1500 

CTGGATTCAT CGACTGTGGC CGGCTGGGTG TGGCGGACCG CTATCAGGAC ATAGCGTTGG 1560 

CTACCCGTGA TATTGCTGAA GAGCTTGGCG GCGAATGGGC TGACCGCTTC CTCGTGCTTT 1620 

ACGGTATCGC CGCTCCCGAT TCGCAGCGCA TCGCCTTCTA TCGCCTTCTT GACGAGTTCT 1680 

TCTGAGCGGG ACTCTGGGGT TCGAAATGAC CGACCAAGCG ACGCCCCTGT TTTGCAATGG 17 4 0 

CGGTCGGCGA AAGTTGATGC GCTGTATCGT GGTGAAGATC AATCCATGCT GCGTGACGAG 1800 

GCCACACTGT GAGTTGGTCA GGGGGGGCTT ACTCGGCGTT TTCCGACACT GCGTTGGTTG 18 60 

CGGCAGTGCG CACCCCCTGG ATTGATTGCG GGGGTGCCCT GTCGCTGGTG TCGCCTATCG 1920 

ACTTAGGGGT AAAGGTCGCT CGCGAAGTTC TGATGCGTGC GTCGCTTGAA CCACAAATGG 1980 

TCGATAGCGT ACTCGCAGGC TCTATGGCTC AAGCAAGCTT TGATGCTTAC CTGCTCCCGC 204 0 

GGCACATTGG CTTGTACAGC GGTGTTCCCA AGTCGGTTCC GGCCTTGGGG GTGCAGCGCA 2100 

TTTGCGGCAC AGGCTTCGAA CTGCTTCGGC AGGCCGGCGA GCAGATTTCC CAAGGCGCTG 2160 

ATCACGTGCT GTGTGTCGCG GGCTGCAG 218 8 



WO 00/26355 fil PCT/EP99/07952 



Sequenz 8 

CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 

TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 4 20 

AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 4 80 

AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 54 0 

AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 

CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 

ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 7 20 

ATGCAGCACC TTTCCAGGGG GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT 780 

TGTAATTCAT TAAGCATTCT GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA 84 0 

ATCGCCAGCG GCATCAGCAC CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC 900 

CGTGGAAACG GATGAAGGCA CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT 960 

AATGCAAGTA GCGTATGCGC TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG 1020 

GTAACGGCGC AGTGGCGGTT TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC 1080 

CTCGGGCATC CAAGCAGCAA GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA 1140 

GCAACGATGT TACGCAGCAG CAACGATGTT ACGCAGCAGG GCAGTCGCCC TAAAACAAAG 1200 

TTAGGTGGCT CAAGTATGGG CATCATTCGC ACATGTAGGC TCGGCCCTGA CCAAGTCAAA 1260 

TCCATGCGGG CTGCTCTTGA TCTTTTCGGT CGTGAGTTCG GAGACGTAGC CACCTACTCC 1320 

CAACATCAGC CGGACTCCGA TTACCTCGGG AACTTGCTCC GTAGTAAGAC ATTCATCGCG 1380 

CTTGCTGCCT TCGACCAAGA AGCGGTTGTT GGCGCTCTCG CGGCTTACGT TCTGCCCAGG 144 0 

TTTGAGCAGC CGCGTAGTGA GATCTATATC TATGATCTCG CAGTCTCCGG CGAGCACCGG 1500 

AGGCAGGGCA TTGCCACCGC GCTCATCAAT CTCCTCAAGC ATGAGGCCAA CGCGCTTGGT 1560 

GCTTATGTGA TCTACGTGCA AG C AG ATT AC GGTGACGATC CCGCAGTGGC TCTCTATACA 1620 

AAGTTGGGCA TACGGGAAGA AG T GAT G C AC TTTGATATCG ACCCAAGTAC CGCCACCTAA 1680 

CAATTCGTTC AAGCCGAGAT CGGCTTCCCC TGTTTTGCAA TGGCGGTCGG CGAAAGTTGA 17 4 0 

TGCGCTGTAT CGTGGTGAAG ATCAATCCAT GCTGCGTGAC GAGGCCACAC TGTGAGTTGG 1800 

TCAGGGGGGG CTTACTCGGC GTTTTCCGAC ACTGCGTTGG TTGCGGCAGT GCGCACCCCC 18 60 

TGGATTGATT GCGGGGGTGC CCTGTCGCTG GTGTCGCCTA TCGACTTAGG GGTAAAGGTC 1920 

GCTCGCGAAG TTCTGATGCG TGCGTCGCTT GAACCACAAA TGGTCGATAG CGTACTCGCA 1980 

GGCTCTATGG CTCAAGCAAG CTTTGATGCT TACCTGCTCC CGCGGCACAT TGGCTTGTAC 204 0 

AGCGGTGTTC CCAAGTCGGT TCCGGCCTTG GGGGTGCAGC GCATTTGCGG CACAGGCTTC 2100 

GAACTGCTTC GGCAGGCCGG CGAGCAGATT TCCCAAGGCG CTGATCACGT GCTGTGTGTC 2160 

GCGGGCTGCA G 2171 
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Sequenz 9 

CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 

TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 4 20 

AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 4 80 

AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 54 0 

AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 

CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 

ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 

ATGCAGCACC TTTCCAGCGC GCTGTTTTGC AATGGCGGTC GGCGAAAGTT GATGCGCTGT 7 80 

ATCGTGGTGA AGATCAATCC ATGCTGCGTG ACGAGGCCAC ACTGTGAGTT GGTCAGGGGG 84 0 

GGCTTACTCG GCGTTTTCCG ACACTGCGTT GGTTGCGGCA GTGCGCACCC CCTGGATTGA 900 

TTGCGGGGGT GCCCTGTCGC TGGTGTCGCC TATCGACTTA GGGGTAAAGG TCGCTCGCGA 960 

AGTTCTGATG CGTGCGTCGC TTGAACCACA AATGGTCGAT AGCGTACTCG CAGGCTCTAT 1020 

GGCTCAAGCA AGCTTTGATG CTTACCTGCT CCCGCGGCAC ' ATTGGCTTGT ACAGCGGTGT 1080 

TCCCAAGTCG GTTCCGGCCT TGGGGGTGCA GCGCATTTGC GGCACAGGCT TCGAACTGCT 114 0 

TCGGCAGGCC GGCGAGCAGA TTTCCCAAGG CGCTGATCAC GTGCTGTGTG TCGCGGGCTG 1200 

CAG 1203 
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Sequenz 10 



GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 20 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 4 80 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGGGGACAG CAAGCGAACC 54 0 

GGAATTGCCA GCTGGGGCGC CCTCTGGTAA GGTTGGGAAG CCCTGCAAAG TAAACTGGAT 600 

GGCTTTCTTG CCGCCAAGGA TCTGATGGCG CAGGGGATCA AGATCTGATC AAGAGACAGG 660 

ATGAGGATCG TTTCGCATGA TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG 720 

GGTGGAGAGG CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC 7 80 

CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 84 0 
TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG TGGCTGGCCA CGACGGGCGT 900 
TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA AGGGACTGGC TGCTATTGGG 9 60 

CGAAGTGCCG GGGCAGGATC TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT 1020 

CATGGCTGAT GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA 1080 

CCAAGCGAAA CATCGCATCG AG C GAG C AC G TACTCGGATG GAAGCCGGTC TTGTCGATCA 114 0 

GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC GAACTGTTCG CCAGGCTCAA 1200 

GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT GGCGATGCCT GCTTGCCGAA 12 60 

TATCATGGTG GAAAATGGCC GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC 1320 

GGACCGCTAT CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA 1380 

ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC AGCGCATCGC 14 4 0 

CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC TGGGGTTCGA AATGACCGAC 1500 

CAAGCGACGC CCCGAGCAGG GCATGAAGCA GTTCCTTGAC G AG AAAAG C A TCAAGCCGGG 1560 

CTTGCAGACC TACAAGCGCT GATAAATGCG CCGGGGCCCT CGCTGCGCCC CCGGCCTTCC 1620 

AATAATGACA ATAATGAGGA GTGCCCAATG TTTCACGTGC CCCTGCTTAT TGGTGGTAAG 1680 

CCTTGTTCAG CAT C T GAT G A GCGCACCTTC GAGCGTCGTA GCCCGCTGAC CGGAGAAGTG 174 0 

GTATCGCGCG TCGCTGCTGC CAGTTTGGAA GATGCGGACG CCGCAGTGGC CGCTGCACAG 1800 

GCTGCGTTTC CTGAATGGGC GGCGCTTGCT CCGAGCGAAC GCCGTGCCCG ACTGCTGCGA 1860 

GCGGCGGATC TTCTAGAGGA CCGTTCTTCC GAGTTCACCG CCGCAGCGAG TGAAACTGGC 1920 

GCAGCGGGAA ACTGGTATGG GTTTAACGTT TACCTGGCGG CGGGCATGTT GCGGGGAATT 1980 

C 1981 
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Sequenz 11 



GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 20 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 4 80 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGGGGGAGA GGCGGTTTGC 54 0 

GTATTGGGCG CAT GC AT AAA AACTGTTGTA ATTCATTAAG CATTCTGCCG ACATGGAAGC 600 

CATCACAAAC GGCATGATGA ACCTGAATCG CCAGCGGCAT CAGCACCTTG TCGCCTTGCG 660 

TATAATATTT GCCCATGGAC GCACACCGTG GAAACGGATG AAGGCACGAA CCCAGTTGAC 7 20 

ATAAGCCTGT TCGGTTCGTA AACTGTAATG CAAGTAGCGT ATGCGCTCAC GCAACTGGTC 7 80 

CAGAACCTTG ACCGAACGCA GCGGTGGTAA CGGCGCAGTG GCGGTTTTCA TGGCTTGTTA 84 0 

TGACTGTTTT TTTGTACAGT CTATGCCTCG GGCATCCAAG CAGCAAGCGC GTTACGCCGT 900 

GGGTCGATGT TTGATGTTAT GGAGCAGCAA CGATGTTACG CAGCAGCAAC GATGTTACGC 9 60 

AGCAGGGCAG TCGCCCTAAA ACAAAGTTAG GTGGCTCAAG TATGGGCATC ATTCGCACAT 1020 

GTAGGCTCGG CCCTGACCAA GTCAAATCCA TGCGGGCTGC TCTTGATCTT TTCGGTCGTG 1080 

AGTTCGGAGA CGTAGCCACC TACTCCCAAC ATCAGCCGGA CTCCGATTAC CTCGGGAACT 1140 

TGCTCCGTAG TAAGACATTC ATCGCGCTTG CTGCCTTCGA CCAAGAAGCG GTTGTTGGCG 12 00 

CTCTCGCGGC TTACGTTCTG CCCAGGTTTG AGCAGCCGCG TAGTGAGATC TATATCTATG 12 60 

ATCTCGCAGT CTCCGGCGAG CACCGGAGGC AGGGCATTGC CACCGCGCTC ATCAATCTCC 1320 

TCAAGCATGA GGCCAACGCG CTTGGTGCTT ATGTGATCTA CGTGCAAGCA GATTACGGTG 1380 

ACGATCCCGC AGTGGCTCTC T AT AC AAAG T TGGGCATACG GGAAGAAGTG ATGCACTTTG 14 4 0 

ATATCGACCC AAGTACCGCC ACCTAACAAT TCGTTCAAGC CGAGATCGGC TTCCCCGAGC 1500 

AGGGCATGAA GCAGTTCCTT GACGAGAAAA GCATCAAGCC GGGCTTGCAG ACCTACAAGC 15 60 

GCTGATAAAT GCGCCGGGGC CCTCGCTGCG CCCCCGGCCT TCCAATAATG ACAATAATGA 1620 

GGAGTGCCCA ATGTTTCACG TGCCCCTGCT TATTGGTGGT AAGCCTTGTT CAGCATCTGA 168 0 

TGAGCGCACC TTCGAGCGTC GTAGCCCGCT GACCGGAGAA GTGGTATCGC GCGTCGCTGC 17 4 0 

TGCCAGTTTG GAAGATGCGG ACGCCGCAGT GGCCGCTGCA CAGGCTGCGT TTCCTGAATG 18 00 

GGCGGCGCTT GCTCCGAGCG AACGCCGTGC CCGACTGCTG CGAGCGGCGG ATCTTCTAGA 18 60 

GGACCGTTCT TCCGAGTTCA CCGCCGCAGC GAGTGAAACT GGCGCAGCGG GAAACTGGTA 1920 

TGGGTTTAAC GTTTACCTGG CGGCGGGCAT GTTGCGGGGA ATTC 1964 
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Sequenz 12 

GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

AT C GAG AG AT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 20 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 4 80 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGCGAGCAG GGCATGAAGC 54 0 

AGTTCCTTGA CGAGAAAAGC ATCAAGCCGG GCTTGCAGAC CTACAAGCGC TGATAAATGC 600 

GCCGGGGCCC TCGCTGCGCC CCCGGCCTTC CAATAATGAC AATAATGAGG AGTGCCCAAT 660 

GTTTCACGTG CCCCTGCTTA TTGGTGGTAA GCCTTGTTCA GCATCTGATG AGCGCACCTT 72 0 

CGAGCGTCGT AGCCCGCTGA CCGGAGAAGT GGTATCGCGC GTCGCTGCTG CCAGTTTGGA 7 80 

AGATGCGGAC GCCGCAGTGG CCGCTGCACA GGCTGCGTTT CCTGAATGGG CGGCGCTTGC 84 0 

TCCGAGCGAA CGCCGTGCCC GACTGCTGCG AGCGGCGGAT CTTCTAGAGG ACCGTTCTTC 900 

CGAGTTCACC GCCGCAGCGA GTGAAACTGG CGCAGCGGGA AACTGGTATG GGTTTAACGT 960 

TTACCTGGCG GCGGGCATGT TGCGGGGAAT TC 992 



WO 00/26355 



66 



PCT/EP99/07952 



Seguenz 13 

GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 24 0 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 4 20 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 4 80 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 54 0 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 7 20 

GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 7 80 
GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 84 0 
CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 
TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 9 60 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 

TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GGGGACAGCA AGCGAACCGG 1080 

AATTGCCAGC TGGGGCGCCC TCTGGTAAGG TTGGGAAGCC CTGCAAAGTA AACTGGATGG 114 0 

CTTTCTTGCC GCCAAGGATC TGATGGCGCA GGGGATCAAG ATCTGATCAA GAGACAGGAT 12 00 

GAGGATCGTT TCGCATGATT GAACAAGATG GATTGCACGC AGGTTCTCCG GCCGCTTGGG 12 60 

TGGAGAGGCT ATTCGGCTAT GACTGGGCAC AACAGACAAT CGGCTGCTCT GATGCCGCCG 1320 

TGTTCCGGCT GTCAGCGCAG GGGCGCCCGG TTCTTTTTGT CAAGACCGAC CTGTCCGGTG 1380 

CCCTGAATGA ACTGCAGGAC GAGGCAGCGC GGCTATCGTG GCTGGCCACG ACGGGCGTTC 14 4 0 

CTTGCGCAGC TGTGCTCGAC GTTGTCACTG AAGCGGGAAG GGACTGGCTG CTATTGGGCG 1500 

AAGTGCCGGG GCAGGATCTC CTGTCATCTC ACCTTGCTCC TGCCGAGAAA GTATCCATCA 15 60 

TGGCTGATGC AATGCGGCGG CTGCATACGC TTGATCCGGC TACCTGCCCA TTCGACCACC 1620 

AAGCGAAACA TCGCATCGAG CGAGCACGTA CTCGGATGGA AGCCGGTCTT GTCGATCAGG 1680 

ATGATCTGGA CG AAG AG CAT CAGGGGCTCG CGCCAGCCGA ACTGTTCGCC AGGCTCAAGG 17 4 0 

CGCGCATGCC CGACGGCGAG GATCTCGTCG TGACCCATGG CGATGCCTGC TTGCCGAATA 1800 

TCATGGTGGA AAATGGCCGC TTTTCTGGAT TCATCGACTG TGGCCGGCTG GGTGTGGCGG 18 60 

ACCGCTATCA GGACATAGCG TTGGCTACCC GTGATATTGC TGAAGAGCTT GGCGGCGAAT 1920 

GGGCTGACCG CTTCCTCGTG CTTTACGGTA TCGCCGCTCC CGATTCGCAG CGCATCGCCT 1980 

TCTATCGCCT TCTTGACGAG TTCTTCTGAG CGGGACTCTG GGGTTCGAAA TGACCGACCA 204 0 

AGCGACGCCC GGCCCAGCGC GTCGATTCGG GCATTTGCCA TATCAATGGA CCGACTGTGC 2100 

ATGACGAGGC TCAGATGCCA TTCGGTGGGG TGAAGTCCAG CGGCTACGGC AGCTTCGGCA 2160 
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GTCGAGCATC GATTGAGCAC TTTACCCAGC TGCGCTGGCT GACCATTCAG AATGGCCCGC 22 20 

GGCACTATCC AATCTAAATC GATCTTCGGG CGCCGCGGGC ATCATGCCCG CGGCGCTCGC 2280 

CTCATTTCAA TCTCTAACTT GATAAAAACA GAGCTGTTCT CCGGTCTTGG TGGATCAAGG 234 0 

CCAGTCGCGG AGAGTCTCGA AGAGGAGAGT ACAGTGAACG CCGAGTCCAC ATTGCAACCG 24 00 

CAGGCATCAT CATGCTCTGC TCAGCCACGC TACCGCAGTG TGTCGATTGG TCATCCTCCG 24 60 

GTTGAGGTTA CGCAAGACGC TGGAGGTATT GTCCGGATGC GTTCTCTCGA GGCGCTTCTT 2520 

CCCTTCCCGG GTGGAATTC 2539 
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Seguenz 14 

GAATTCCAAT AATGACAATA AT GAG GAG TG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 24 0 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 3 60 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 4 2.0 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 4 80 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 54 0 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 7 20 

GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 7 80 

GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 84 0 

CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 

TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 

TGCAGGTCAA CGCATCCAGG TGGGGAGAGG CGGTTTGCGT ATTGGGCGCA TGCATAAAAA 1080 

CTGTTGTAAT TCATTAAGCA TTCTGCCGAC ATGGAAGCCA TCACAAACGG CATGATGAAC 114 0 

CTGAATCGCC AGCGGCATCA GCACCTTGTC GCCTTGCGTA TAATATTTGC CCATGGACGC 1200 

ACACCGTGGA AACGGATGAA GGCACGAACC CAGTTGACAT AAGCCTGTTC GGTTCGTAAA 12 60 

CTGTAATGCA AGTAGCGTAT GCGCTCACGC AACTGGTCCA GAACCTTGAC CGAACGCAGC 1320 

GGTGGTAACG GCGCAGTGGC GGTTTTCATG GCTTGTTATG ACTGTTTTTT TGTACAGTCT 1380 

ATGCCTCGGG CAT CC AAGC A GCAAGCGCGT TACGCCGTGG GTCGATGTTT GATGTTATGG 14 4 0 

AGCAGCAACG ATGTTACGCA GCAGCAACGA TGTTACGCAG CAGGGCAGTC GCCCTAAAAC 1500 

AAAGTTAGGT GGCTCAAGTA TGGGCATCAT TCGCACATGT AGGCTCGGCC CTGACCAAGT 1560 

CAAATCCATG CGGGCTGCTC TTGATCTTTT CGGTCGTGAG TTCGGAGACG TAGCCACCTA 1620 

CTCCCAACAT CAGCCGGACT CCGATTACCT CGGGAACTTG CTCCGTAGTA AGACATTCAT 168 0 

CGCGCTTGCT GCCTTCGACC AAGAAGCGGT TGTTGGCGCT CTCGCGGCTT ACGTTCTGCC 17 4 0 

CAGGTTTGAG CAGCCGCGTA GTGAGATCTA TATCTATGAT CTCGCAGTCT CCGGCGAGCA 1800 

CCGGAGGCAG GGCATTGCCA CCGCGCTCAT CAATCTCCTC AAGCATGAGG CCAACGCGCT 18 60 

TGGTGCTTAT GTGATCTACG TGCAAGCAGA TTACGGTGAC GATCCCGCAG TGGCTCTCTA 1920 

TACAAAGTTG GGCATACGGG AAGAAGTGAT GCACTTTGAT ATCGACCCAA GTACCGCCAC 198 0 

CTAACAATTC GTTCAAGCCG AGATCGGCTT CCCAATTGGC CCAGCGCGTC GATTCGGGCA 204 0 

TTTGCCATAT CAATGGACCG ACTGTGCATG ACGAGGCTCA GATGCCATTC GGTGGGGTGA 2100 

AGTCCAGCGG CTACGGCAGC TTCGGCAGTC GAGCATCGAT TGAGCACTTT ACCCAGCTGC 2160 
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GCTGGCTGAC CATTCAGAAT GGCCCGCGGC ACTATCCAAT CTAAATCGAT CTTCGGGCGC 2220 

CGCGGGCATC ATGCCCGCGG CGCTCGCCTC ATTTCAATCT CTAACTTGAT AAAAACAGAG 228 0 

CTGTTCTCCG GTCTTGGTGG ATCAAGGCCA GTCGCGGAGA GTCTCGAAGA GGAGAGTACA 234 0 

GTGAACGCCG AGTCCACATT GCAACCGCAG GCATCATCAT GCTCTGCTCA GCCACGCTAC 2 4 00 

CGCAGTGTGT CGATTGGTCA TCCTCCGGTT GAGGTTACGC AAGACGCTGG AGGTATTGTC 2 4 60 

CGGATGCGTT CTCTCGAGGC GCTTCTTCCC TTCCCGGGTG GAATTC 250 6 
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Sequenz 15 

GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 24 0 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 4 20 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 4 80 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 54 0 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 7 20 

GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT 7 80 

GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 84 0 

CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 

TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 

TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GCAAAAGGCG CGCAATGGAA 108 0 

TTGGCCCAGC GCGTCGATTC GGGCATTTGC CATATCAATG GACCGACTGT GCATGACGAG 114 0 

GCTCAGATGC CATTCGGTGG GGTGAAGTCC AGCGGCTACG GCAGCTTCGG CAGTCGAGCA 1200 

TCGATTGAGC ACTTTACCCA GCTGCGCTGG CTGACCATTC AGAATGGCCC GCGGCACTAT 12 60 

CCAATCTAAA TCGATCTTCG GGCGCCGCGG GCATCATGCC CGCGGCGCTC GCCTCATTTC 1320 

AATCTCTAAC TTGATAAAAA CAGAGCTGTT CTCCGGTCTT GGTGGATCAA GGCCAGTCGC 138 0 

GGAGAGTCTC GAAGAGGAGA GTACAGTGAA CGCCGAGTCC ACATTGCAAC CGCAGGCATC 14 4 0 

ATCATGCTCT GCTCAGCCAC GCTACCGCAG TGTGTCGATT GGTCATCCTC CGGTTGAGGT 1500 

TACGCAAGAC GCTGGAGGTA TTGTCCGGAT GCGTTCTCTC GAGGCGCTTC TTCCCTTCCC 1560 

GGGTGGAATT C 1571 
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Sequenz 1 6 

GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 24 0 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 4 2.0 

AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC 4 80 

GTATACACAC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 54 0 

GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGG 600 

GACAGCAAGC GAACCGGAAT TGCCAGCTGG GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG 660 

CAAAGTAAAC TGGATGGCTT TCTTGCCGCC AAGGATCTGA TGGCGCAGGG GATCAAGATC 720 

TGATCAAGAG ACAGGATGAG GATCGTTTCG CATGATTGAA CAAGATGGAT TGCACGCAGG 7 80 

TTCTCCGGCC GCTTGGGTGG AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG 84 0 

CTGCTCTGAT GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA 900 

GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC TATCGTGGCT 960 

GGCCACGACG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT GTCACTGAAG CGGGAAGGGA 1020 

CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA GGATCTCCTG TCATCTCACC TTGCTCCTGC 108 0 

CGAGAAAGTA TCCATCATGG CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC 114 0 

CTGCCCATTC GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC 1200 

CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC CAGCCGAACT 1260 

GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT CTCGTCGTGA CCCATGGCGA 132 0 

TGCCTGCTTG CCGAATATCA TGGTGGAAAA TGGCCGCTTT TCTGGATTCA TCGACTGTGG 1380 

CCGGCTGGGT GTGGCGGACC GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA 14 40 

AGAGCTTGGC GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA 1500 

TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG GACTCTGGGG 1560 

TTCGAAATGA CCGACCAAGC GACGCCCATT GAGGGCGCAA GAGGAGAAAT GGATTGACCA 1620 

AGAGATCGTG GCTGTTACGG ATGAACAGTT CGATTTAGAG GGCTACAACA GTCGAGCAAT 1680 

TGAACTGCCT CGGAAGGCAA AATTGTTGAT CGTGACAGTC ATCCGCGGCC TAGCAGTCTT 17 4 0 

TGAAGCCCTT TCCCGATTGA AGCCTGTTCA TTCTGGCGGG GTGCAGACTG CGGGCAACAG 1800 

CTGTGCCGTA GTGGACGGCG CCGCGGCGGC TTTGGTGGCT CGAGAGTCGT CTGCGACACA 18 60 

GCCGGTCTTG GCTAGGATAC TGGCTACCTC CGTAGTCGGG ATCGAGCCCG AGCATATGGG 1920 

GCTCGGCCCT GCGCCCGCGA TTCGCCTGCT GCTTGCGCGT AGTGATCTTA GTTTGAGGGA 1980 

TATCGACCTC TTTGAGATAA ACGAGGCGCA GGCCGCCCAA GTTCTAGCGG TACAGCATGA 204 0 

ATTGGGTATT GAGCACTCAA AACTTAATAT TTGGGGCGGG GCCATTGCAC TTGGACACCC 2100 

GCTTGCCGCG ACCGGATTGC GTCTCTGCAT GACCCTCGCT CACCAATTGC AAGCTAATAA 2160 
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CTTTCGATAT GGAATTGCCT CGGCATGCAT TGGTGGGGGA CAGGGGATGG CGGTTCTTTT 2220 

AGAGAATCCC CACTTCGGTT CGTCCTCTGC ACGAAGTTCG ATGATTAACA GAGTTGACCA 2280 

CTATCCACTG AGCTAACGGG CATCTCCTTT GTTGCTTTGA GGTGGCGCAC GAAGGAGGGC 234 0 

TCGAAAATCT CTGCTAAAAA CAAGAAGAAG GAACAGGGAA CATGATTAGT TTCGCTCGTA 24 00 

TGGCAGAAAG TTTAGGAGTC CAGGCTAAAC TTGCCCTTGC CTTCGCACTC GTATTATGTG 24 60 

TCGGGCTGAT TGTTACCGGC ACGGGTTTCT ACAGTGTACA TACCTTGTCA GGGTTGGTGG 2 520 

GAATTC 252 6 
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Sequenz 17 

GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 24 0 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 4 20 

AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC 4 80 

GTATACACAC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 54 0 

GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGG 600 

GGAGAGGCGG TTTGCGTATT GGGCGCATGC ATAAAAACTG TTGTAATTCA TTAAGCATTC 660 

TGCCGACATG GAAGCCATCA CAAACGGCAT GATGAACCTG AATCGCCAGC GGCATCAGCA 7 20 

CCTTGTCGCC TTGCGTATAA TATTTGCCCA TGGACGCACA CCGTGGAAAC GGATGAAGGC 7 80 

ACGAACCCAG TTGACATAAG CCTGTTCGGT TCGTAAACTG TAATGCAAGT AGCGTATGCG 84 0 

CTCACGCAAC TGGTCCAGAA CCTTGACCGA ACGCAGCGGT GGTAACGGCG CAGTGGCGGT 900 

TTTCATGGCT TGTTATGACT GTTTTTTTGT ACAGTCTATG CCTCGGGCAT CCAAGCAGCA 960 

AGCGCGTTAC GCCGTGGGTC GATGTTTGAT GTTATGGAGC AGCAACGATG TTACGCAGCA 1020 

GCAACGATGT TACGCAGCAG GGCAGTCGCC CTAAAACAAA GTTAGGTGGC TCAAGTATGG 1080 

GCATCATTCG CACATGTAGG CTCGGCCCTG ACCAAGTCAA ATCCATGCGG GCTGCTCTTG 114 0 

ATCTTTTCGG TCGTGAGTTC GGAGACGTAG CCACCTACTC CCAACATCAG CCGGACTCCG 1200 

ATTACCTCGG GAACTTGCTC CGTAGTAAGA CATTCATCGC GCTTGCTGCC TTCGACCAAG 12 60 

AAGCGGTTGT TGGCGCTCTC GCGGCTTACG TTCTGCCCAG GTTTGAGCAG CCGCGTAGTG 1320 

AGATCTATAT CTATGATCTC GCAGTCTCCG GCGAGCACCG GAGGCAGGGC ATTGCCACCG 1380 

CGCTCATCAA TCTCCTCAAG CATGAGGCCA ACGCGCTTGG TGCTTATGTG ATCTACGTGC 14 4 0 

AAGCAGATTA CGGTGACGAT CCCGCAGTGG CTCTCTATAC AAAGTTGGGC ATACGGGAAG 1500 

AAGTGATGCA CTTTGATATC GACCCAAGTA CCGCCACCTA ACAATTCGTT CAAGCCGAGA 1560 

TCGGCTTCCC ATTGAGGGCG CAAGAGGAGA AATGGATTGA CCAAGAGATC GTGGCTGTTA 1620 

CGGATGAACA GTTCGATTTA GAGGGCTACA ACAGTCGAGC AATTGAACTG CCTCGGAAGG 1680 

CAAAATTGTT GATCGTGACA GTCATCCGCG GCCTAGCAGT CTTTGAAGCC CTTTCCCGAT 17 4 0 

TGAAGCCTGT TCATTCTGGC GGGGTGCAGA CTGCGGGCAA CAGCTGTGCC GTAGTGGACG 1800 

GCGCCGCGGC GGCTTTGGTG GCTCGAGAGT CGTCTGCGAC ACAGCCGGTC TTGGCTAGGA 18 60 

TACTGGCTAC CTCCGTAGTC GGGATCGAGC C CG AG CAT AT GGGGCTCGGC CCTGCGCCCG 1920 

CGATTCGCCT GCTGCTTGCG CGTAGTGATC TTAGTTTGAG GGATATCGAC CTCTTTGAGA 1980 

TAAACGAGGC GCAGGCCGCC CAAGTTCTAG CGGTACAGCA TGAATTGGGT ATTGAGCACT 204 0 

CAAAACTTAA TATTTGGGGC GGGGCCATTG C ACT TGG AC A CCCGCTTGCC GCGACCGGAT 2100 

TGCGTCTCTG CATGACCCTC GCTCACCAAT TGCAAGCTAA TAACTTTCGA TATGGAATTG 2160 
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CCTCGGCATG CATTGGTGGG GGACAGGGGA TGGCGGTTCT TTTAGAGAAT CCCCACTTCG 2220 

GTTCGTCCTC TGCACGAAGT TCGATGATTA ACAGAGTTGA CCACTATCCA CTGAGCTAAC 228 0 

GGGCATCTCC TTTGTTGCTT TGAGGTGGCG CACGAAGGAG GGCTCGAAAA TCTCTGCTAA 234 0 

AAACAAGAAG AAGGAACAGG GAACATGATT AGTTTCGCTC GTATGGCAGA AAGTTTAGGA 24 00 

GTCCAGGCTA AACTTGCCCT TGCCTTCGCA CTCGTATTAT GTGTCGGGCT GATTGTTACC 2 4 60 

GGCACGGGTT TCTACAGTGT ACATACCTTG TCAGGGTTGG TGGGAATTC 2509 
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Sequenz 18 

GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 120 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 180 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 24 0 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 300 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 360 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 4 20 

AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC 4 80 

G TAT AC AC AC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG 54 0 

GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGC 600 

GCGCATTGAG GGCGCAAGAG GAGAAATGGA TTGACCAAGA GATCGTGGCT GTTACGGATG 660 

AACAGTTCGA TTTAGAGGGC TACAACAGTC GAGCAATTGA ACTGCCTCGG AAGGCAAAAT 7 20 

TGTTGATCGT GACAGTCATC CGCGGCCTAG CAGTCTTTGA AGCCCTTTCC CGATTGAAGC 780 

CTGTTCATTC TGGCGGGGTG CAGACTGCGG GCAACAGCTG TGCCGTAGTG GACGGCGCCG 84 0 

CGGCGGCTTT GGTGGCTCGA GAGTCGTCTG CGACACAGCC GGTCTTGGCT AGGATACTGG 900 

CTACCTCCGT AGTCGGGATC GAGCCCGAGC ATATGGGGCT CGGCCCTGCG CCCGCGATTC 9 60 

GCCTGCTGCT TGCGCGTAGT GATCTTAGTT TGAGGGATAT CGACCTCTTT GAGATAAACG 1020 

AGGCGCAGGC CGCCCAAGTT CTAGCGGTAC AGCATGAATT GGGTATTGAG CACTCAAAAC 1080 

TTAATATTTG GGGCGGGGCC ATTGCACTTG GACACCCGCT TGCCGCGACC GGATTGCGTC 114 0 

TCTGCATGAC CCTCGCTCAC CAATTGCAAG CTAATAACTT TCGATATGGA ATTGCCTCGG 12 00 

CATGCATTGG TGGGGGACAG GGGATGGCGG TTCTTTTAGA GAATCCCCAC TTCGGTTCGT 12 60 

CCTCTGCACG AAGTTCGATG ATTAACAGAG TTGACCACTA TCCACTGAGC TAACGGGCAT 1320 

CTCCTTTGTT GCTTTGAGGT GGCGCACGAA GGAGGGCTCG AAAATCTCTG CTAAAAACAA 1380 

GAAGAAGGAA CAGGGAACAT GATTAGTTTC GCTCGTATGG CAGAAAGTTT AGGAGTCCAG 14 4 0 

GCTAAACTTG CCCTTGCCTT CGCACTCGTA TTATGTGTCG GGCTGATTGT TACCGGCACG 1500 

GGTTTCTACA GTGTACATAC CTTGTCAGGG TTGGTGGGAA TTC 154 3 
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